Digital Signal Processing and System Theory

Talk Moritz Paulsen


mopa
Aufbau und Echtzeitimplementierung eines Konferenzsystems mit frequenzselektiver Sprecherlokalisierung und Audioübertragung mittels UDP/IP-basiertem Netzwerkprotokoll (in German)

Date: 16.02.2012, 13:00 h - 14:00 h
Room: Aquarium

Moritz Paulsen
CAU, Kiel, Germany


Details (talk will be in German)



Im Rahmen dieser Arbeit wurden vier Mikrofonarrays, je eines in den Tischplatten von zwei Arbeitsplätzen sowie zwei in einem Konferenztisch, eingebaut und verkabelt. Eine UDP/IP-basierte Audioübertragung wurde implementiert und verschiedene Möglichkeiten zur Sprecherlokalisierung untersucht und teilweise umgesetzt.
Bei der Umsetzung der UDP/IP-Audioübertragung hat sich gezeigt, dass eine qualitativ hochwertige übertragung mit einfachen Mitteln möglich ist, zusätzlich konnte eine simple Korrektur von Fehlern, die durch das Netzwerkrouting auftreten können, mit Hilfe von Paketnummerierungen umgesetzt werden. Es wurde gezeigt, dass die Korrektur von Abtastratenunterschieden der verschiedenen Endgeräte möglich ist, für die gegebenen Hardwarebedingungen allerdings nicht unbedingt nötig ist. Zudem wurden einige Vor- und Nachteile bei der UDP/IP-Programmierung mit Qt herausgestellt. Als größter und störendster Nachteil kann die Zugehörigkeit zum Qt-Thread genannt werden, die dafür sorgt, dass die übertragung aussetzt, sobald Prozesse der GUI aufgerufen werden.
Im Rahmen der Untersuchungen zur Sprecherlokalisierung wurde ein Verfahren zur Schätzung von Laufzeitunterschieden mit Hilfe einer Kreuzkorrelations-basierten Methode vorgestellt. Es wurden verschiedenen Gewichtungen der Kreuzkorrelation untersucht, bei der sich die PHAT-Methode als besste Lösung für die Echtzeit-Umsetzung herausstellte. Als günstiges und gutes Kriterium zum Abschätzen der Verlässlichkeit dieser Schätzungen wurde der Wert des Maximums der Kreuzkorrelationsfunktion bestätigt. Es wurden verschiedene Ansätze zur Lokalisierung mit den berechneten Laufzeitunterschieden vorgestellt und untersucht, dabei zeigte sich die zweidimensionale Geometrie der Mikrofonarrays in den Tischen als einschränkende Gegebenheit bei der dreidimensionalen Ortung von Sprechern. Für ein quadratisches Mikrofonarray wurde ein rekursives Näherungsverfahren für Azimut- und Elevationswinkel eines Sprechers entwickelt und vorgestellt.