| 12:45 |
-
Künstliche Intelligenz für akustische Sensorsysteme
André Gerlach, Jona Eisele
[Abstract]
Akustische Sensoren sind in zahlreichen Anwendungen zu finden. Dazu gehören Anwendungen in direkten akustischen Systemen, wie z. B. in Beschallungssystemen oder aktiven Lärmminderungssystemen. Andere Systeme nutzen Schall, um Messungen durchzuführen, wie z. B. zur Entfernungsbestimmung über eine Laufzeitmessung, zur Temperaturmessung oder zur Anwesenheitsüberwachung. Dieser Beitrag gibt eine Übersicht zu Anwendungen in der Luftschallakustik. Fragen, die sich beim Aufsetzen eines KI-Systems ergeben, sollen beleuchtet werden. So stellt sich beispielsweise die Frage ob die gemessenen Signale, z. B. der Schalldruck, direkt als Input eines neuronalen Netzwerkes verwendet werden oder in einem Signalvorverarbeitungsschritt Merkmale extrahiert werden. Solche Merkmale können einfache Kennzahlen wie der gleitende Effektivwert oder aber komplexe wie eine Zeit-Frequenz-Transformation, wie z. B. die Kurzzeit-Fourier-Transformation sein. Eine wichtige Frage für das Training des KI-Systems stellt eine ausreichende Menge an bekannten Datensätzen (gelabelt) dar. Sind die Messmöglichkeiten diesbezüglich nicht ausreichend, sind in der Luftschallakustik verschiedene Möglichkeiten der Daten-Augmentation gegeben. Eine wichtige Frage ist die Wahl der Netzwerk-Architektur und Netzwerk-Größe. Schließlich stellt sich auch die Frage der Verlässlichkeit und Nachvollziehbarkeit von Ergebnissen eines KI-Systems.
|
| 13:10 |
-
Analyse von akustischen Daten im Kontext von Deep Learning mittels Zeit-Frequenz Darstellungen
Daniel Haider, Lorenz Gutscher, Peter Balazs
[Abstract]
Künstliche Intelligenz als grundlegender Mechanismus zur Steuerung von Prozessen und Verarbeitung von
Daten ist in den letzten Jahren immer weiter in den Vordergrund gerückt. Insbesondere haben sich
künstliche neuronale Netze als dominante Modelle etabliert, die komplexe Datenstrukturen erfassen und
verarbeiten können. Für die Umsetzung einer Lernaufgabe mittels eines solchen Modells werden sowohl für
die Aufbereitung der Daten als auch für die Architektur des Modells Methoden aus der Signalverarbeitung
verwendet.
In diesem Tutorial zeigen wir wie verschiedene akustische Signalklassen, die sensorischen Messungen
entspringen, in passende Zeit-Frequenz Darstellungen transformiert werden können, um diese einem Deep
Learning Modell zu übergeben. Das neuronale Netz soll auf Basis der Daten eine bestimmte Lernaufgabe
lösen, etwa Klassifizierung oder Regression. Neben der generellen Struktur des Netzes betrachten wir
verschiedene Möglichkeiten die Zeit-Frequenz Darstellungen durch Verwendung von Filtern signalabhängig
einzuspeisen. Anhand eines praktischen Code-Beispiels demonstrieren wir den Prozess von
Datenverarbeitung, Training und Evaluation des Modells in Python unter der zusätzlichen Verwendung der
Large Time-Frequency Toolbox (LTFAT).
|
| 13:35 |
-
Sichere, robuste, und erklärbare Künstliche Intelligenz Methoden für Perzeption
Michael Pfeiffer
[Abstract]
Methoden der künstlichen Intelligenz (KI), insbesondere Deep Learning, haben in den vergangenen Jahren massiv dazu beigetragen die Leistung von Signalverarbeitungs-Algorithmen zu steigern, und damit Anwendungen in der physischen Welt, wie z.B. Automatisiertes Fahren zu ermöglichen. Insbesondere die Wahrnehmung der Umgebung anhand von vielfältigen Sensorsignalen, u.a. mit Kameras, Radar, Ultraschall, Lidar, oder Mikrophonen, stellt eine große Herausforderung dar. Anders als in akademischen Datensätzen muss man bei der Anwendung im echten Fahrzeug mit unvorhersehbaren Fehlerquellen rechnen: ungewöhnliche Wetter- oder Verkehrssituationen, unbekannte Objekte, oder verrauschte Sensoren. In präsentiere neueste Erkenntnisse aus der KI Forschung bei Bosch vor, mit denen die Robustheit von Neuronalen Netzwerken untersucht und erhöht werden kann. Weiters wird gezeigt wie die Entscheidungen neuronaler Netze erklärbar gemacht werden, um problematische gelernte Zusammenhänge zu erkennen und zu beseitigen. Um solche Algorithmen auch auf Chips mit eingeschränkter Rechenkapazität im Feld laufen lassen zu können, stelle ich die neuronale Architektursuche vor, mit der Genauigkeit und Effizienz von Deep Learning optimiert werden kann. Anwendungen in verschiedenen sensorischen Domänen, u.a. für Video und Radar, werden gezeigt, und die Übertragbarkeit auf akustische Anwendungen besprochen. Die vorgestellten Methoden sind mächtige Werkzeuge um komplexe Echtwelt-Probleme mit KI Methoden zu adressieren, und deren Performanz und Effizienz kontinuierlich zu steigern.
|
| 14:20 |
-
Entwicklung akustischer Messungen für industrielles maschinelles Lernen
Christian Fuchs, Steffen Klein, Stefan Saller, Daniel Spies, Andreas Schütze, Tizian Schneider
[Abstract]
Einige Defekte an industriellen Maschinen können von Experten aufgrund von akustischen Ereignissen erkannt werden. Durch die bisherigen Erfolge in
der Spracherkennung motiviert dies zur Nutzung maschinellen Lernens für industrielle akustische Messungen.
Als Beispiel werden hier Messungen an Antrieben von Festo angeführt, deren Dichtungen Leckagen aufweisen. Das Ziel ist es, die Leckage(n) per
MEMS-Mikrofon zu erkennen.
Da maschinelles Lernen die Messkette um statistische Datenauswertung erweitert, stellt es besondere Anforderungen an das Design of Experiment
(DoE) und die Messkette. Bei akustischen Messungen spielen Noise und Clipping eine große Rolle. Es gilt also, einen geschickten Dynamikbereich zu
finden und einen sinnvollen Nutzsignalbereich mit ausreichendem Signalrauschabstand (SNR) in den Messsignalen zu suchen.
Um physikalisches Clipping zu vermeiden, wurde das Mikrofon in ein Gehäuse mit konischer Einfräsung eingebaut. Außerdem wurde das Gain auf einen
Nutzsignalbereich optimiert und die Einzelmessungen wurden entsprechend segmentiert, um Datenhomogenität zu erreichen.
Zur Erfüllung der statistischen Anforderungen wurde das DoE per Latin Hypercube Sampling (LHS) durchgeführt. Dazu wurden Daten mit verschiedenen
Leckagenstärken, verschiedenen beaufschlagten Drücken und Einstellungen der Drossel aufgezeichnet. Somit werden Robustheit zu unterschiedlichen
Druck- und Drosseleinstellungen sowie die Lernbarkeit des Targets (Leckage) ermöglicht. Rauschsignale können für Robustheitstests und
weiterführende Vergleiche im Nachhinein eingefügt werden.
|
| 14:45 |
-
Intelligentes akustisches Monitoring durch ausgewählte Mikrofonierungskonzepte
Tobias Fritsch, Joachim Bös, Sascha Grollmisch, Saichand Gourishetti, Peter Hofmann, Judith Liebetrau
[Abstract]
Akustische Signale geben dem Menschen wichtige Informationen über ihre Umgebung. Dies gelingt dadurch, dass die Schallsignale im Gehirn mit anderen Sensorinformationen, Erfahrungswerten, Erinnerungen oder auch Emotionen verknüpft werden. Beim akustischen Monitoring wird versucht, diese menschliche Fähigkeit automatisiert und objektiviert nachzubilden. Akustische Signale werden mittels geeigneter Sensorik aufgenommen, mit klassischer Signalanalyse oder mithilfe maschineller Lernverfahren analysiert und mit Wissen verknüpft. Anschließend werden daraus Handlungsempfehlungen abgeleitet. Akustisches Monitoring wird u. a. dazu genutzt, Defekte an Maschinen oder Prozessveränderungen automatisiert zu erkennen. Um jedoch eine präzise automatische Ereignis- oder Anomaliedetektion zu erzielen, müssen Daten in erforderlicher Menge und Qualität erhoben werden. Einen großen Einfluss auf die Datenqualität und den Erfassungsaufwand haben dabei das verwendete Sensorkonzept (z. B. Mikrofon) und auftretende akustische Phänomene. Ohne eine solche Berücksichtigung ist weder eine optimale Datengrundlage garantiert noch das Wissen für eine robuste KI-basierte Klassifikation von Geräuschen oder die Erkennung von akustischen Abweichungen potenziell ausgeschöpft. In diesem Beitrag wird das Potenzial abgestimmter Kombinationen aus Sensorik (Mikrofon) und KI-Algorithmik für eine ausgewählte Schallfeldsituation dargestellt. Dabei werden Faktoren wie Mikrofonrichtcharakteristik, Mikrofonanzahl oder Vorverarbeitung des Mikrofonsignals näher betrachtet.
|
| 15:10 |
-
The effect of room acoustics and channel coding on affective computing in far field speech interaction
Ingo Siegert, Oliver Niebuhr, Martin Gottschalk, Oliver Jokisch
[Abstract]
Das Aufkommen kommerzieller Sprachassistenten hat die Forschung in Bezug auf Erkennung, Verständnis und Einsatzgebiete auf ein neues Niveau gehoben.
Hauptgründe dafür sind die gegebene Natürlichkeit des Sprechens als Kommunikationsform. In diesem Sinne unterscheidet sich die Nutzung eines sprachgesteuerten Mobiltelefons nicht wesentlich von der Sprachsteuerung einer Smart Home-Anwendung.
Sprachassistenten der Zukunft sollen jedoch nicht nur die Bedienung eines technischen Systems vereinfachen, sondern eine vollkommen freie natürliche Interaktion ermöglichen. Dazu gehört, dass die gesamte Bandbreite menschlicher Ausdrucksweisen verstanden wird.
Aktuelle Sprachassistenten sind sehr gut im Erkennen und Verstehen von Sprachinhalten im Sinne einer Sachinformation, haben aber Defizite im Verstehen weiterer Aspekte der Sprachebenen. Die Sachinformation ist meist nicht die wichtigste, und Defizite im Verstehen weiterer Aspekte der Sprache (z.B. Prosodie, Affekt, Charisma) führt zu vielen Fehlinterpretationen.
In den letzten Jahrzehnten hat die Forschung aktiv Techniken entwickelt, die es erlauben, affektive Informationen des Sprechers zu erkennen und in den Entscheidungsprozess von technischen Assistenten einzubeziehen.
Da diese Untersuchungen meist datengetrieben sind und auf KI-Modellierung basieren, werden die Auswirkungen unterschiedlicher akustischer Umgebungen oder Übertragungskanäle leider oft vernachlässigt. Der Beitrag zeigt daher den Einfluss unterschiedlicher Kanalcodierung und unterschiedlicher Raumakustik auf die Merkmalsrepräsentation und Erkennungsleistung von affektiven Zuständen oder charismatischen Informationen auf.
|
| 15:55 |
-
Inverse Bestimmung elastischer Materialparameter aus dem Ausbreitungsverhalten geführter Ultraschallwellen mittels eines Convolutional-Neuronal-Networks
Mathias Held, Yevgeniya Lugovtsova, Jannis Bulling, Abdalla Rashwan, Maik Lauschkin, Jens Prager
[Abstract]
Geführte Ultraschallwellen sind für die Materialcharakterisierung geeignet, da ihr Ausbreitungsverhalten abhängig von den Materialeigenschaften des
untersuchten Werkstoffs ist. Um aus dem messtechnisch ermittelten Ausbreitungsverhalten geführter Ultraschallwellen Rückschlüsse auf die Materialparameter zu ziehen, werden in der
aktuellen Forschung verschiedene inverse Methoden diskutiert. Dispersionsabbildungen im Frequenz-Wellenzahl-Bereich repräsentieren das
Ausbreitungsverhalten geführter Ultraschallwellen. Maschinelles Lernen und insbesondere Convolutional-Neural-Networks (CNNs) sind eine Möglichkeit der
automatisierten inversen Bestimmung der Materialparameter aus den Dispersionsabbildungen. In diesem Beitrag wird anhand synthetischer Daten gezeigt, wie das Ausbreitungsverhalten von geführten Ultraschallwellen unter Verwendung von CNNs und
Dispersionsabbildungen genutzt werden kann, um die elastischen Konstanten einer isotropen plattenförmigen Struktur zu bestimmen. Anhand dieses
Beispiels wird das generelle Vorgehen zur Anwendung maschineller neuronaler Lernverfahren aufgezeigt. Hierfür werden die verwendeten Daten analysiert,
das Preprocessing erläutert, eine einfache CNN-Architektur gewählt und Saliency Maps erstellt. Im Rahmen der Auswertung wird insbesondere Wert auf die
Erklärbarkeit und Zuverlässigkeit des verwendeten CNNs gelegt und so Grenzen und Möglichkeiten aufgezeigt.
|
| 16:20 |
-
Soft Vibration Sensor: Load prediction using Deep Neural Networks
Daniel Kreuter, Anuj Sharma
[Abstract]
Convolutional Neural Networks (CNN) have significantly contributed to increase the accuracy of regression-based methods. In the field of image recognition different deep learning networks based on CNN layers are standardized and can be adapted for different use cases now. It has been shown that CNN can be used as well as virtual sensors to approximate vibration responses at different locations to reduce the number of sensors or predict vibration signals in general. Furthermore, the usage of deep neural networks simplify, accelerate and improve load prediction at different system levels for vibration signals. Developed is a framework for a vibration soft sensor to predict loads and hence reduce the reliability testing and simulation effort. Preliminary applications of vibration soft sensors on automotive components will be presented.
|