Digital Signal Processing and System Theory

Talk Martin Fischer


mafi
Empirical Mode Decomposition Applied on EEG Signals in Real Time

Date: 23.11.2012, 15:00 h - 15:45 h
Room: Aquarium

Martin Fischer
CAU, Kiel, Germany


Details



Electroencephalogram (EEG) data are often contaminated with artifacts. Several methods have been proposed to enhance the EEG recordings based on the Empirical Mode Decomposition (EMD), an adaptive data-driven technique, which decomposes non-stationary and non-linear data into a number of Intrinsic Mode Functions (IMF). Once that the IMFs are obtained, they are used for denoising and detrending purposes. This thesis presents a real-time implementation of the EMD algorithm. Overlapping windows are used to minimize the errors which arise due to the block-wise processing. Furthermore, the output of the real-time implementation is used for signal enhancement. The contaminated IMFs are identified and attenutated. The results show that the proposed techniques can succesfully suppress eye movement aritfacts and muscle artifcats, while sharp waves arising from epilepsy are preserved. A graphical user interface has been created and was added to the Kiel Real-Time Audio Toolkit. It allows the user to observe and manipulate the EMD to enhance the signals.

Talk Moritz Paulsen


mopa
Aufbau und Echtzeitimplementierung eines Konferenzsystems mit frequenzselektiver Sprecherlokalisierung und Audioübertragung mittels UDP/IP-basiertem Netzwerkprotokoll (in German)

Date: 16.02.2012, 13:00 h - 14:00 h
Room: Aquarium

Moritz Paulsen
CAU, Kiel, Germany


Details (talk will be in German)



Im Rahmen dieser Arbeit wurden vier Mikrofonarrays, je eines in den Tischplatten von zwei Arbeitsplätzen sowie zwei in einem Konferenztisch, eingebaut und verkabelt. Eine UDP/IP-basierte Audioübertragung wurde implementiert und verschiedene Möglichkeiten zur Sprecherlokalisierung untersucht und teilweise umgesetzt.
Bei der Umsetzung der UDP/IP-Audioübertragung hat sich gezeigt, dass eine qualitativ hochwertige übertragung mit einfachen Mitteln möglich ist, zusätzlich konnte eine simple Korrektur von Fehlern, die durch das Netzwerkrouting auftreten können, mit Hilfe von Paketnummerierungen umgesetzt werden. Es wurde gezeigt, dass die Korrektur von Abtastratenunterschieden der verschiedenen Endgeräte möglich ist, für die gegebenen Hardwarebedingungen allerdings nicht unbedingt nötig ist. Zudem wurden einige Vor- und Nachteile bei der UDP/IP-Programmierung mit Qt herausgestellt. Als größter und störendster Nachteil kann die Zugehörigkeit zum Qt-Thread genannt werden, die dafür sorgt, dass die übertragung aussetzt, sobald Prozesse der GUI aufgerufen werden.
Im Rahmen der Untersuchungen zur Sprecherlokalisierung wurde ein Verfahren zur Schätzung von Laufzeitunterschieden mit Hilfe einer Kreuzkorrelations-basierten Methode vorgestellt. Es wurden verschiedenen Gewichtungen der Kreuzkorrelation untersucht, bei der sich die PHAT-Methode als besste Lösung für die Echtzeit-Umsetzung herausstellte. Als günstiges und gutes Kriterium zum Abschätzen der Verlässlichkeit dieser Schätzungen wurde der Wert des Maximums der Kreuzkorrelationsfunktion bestätigt. Es wurden verschiedene Ansätze zur Lokalisierung mit den berechneten Laufzeitunterschieden vorgestellt und untersucht, dabei zeigte sich die zweidimensionale Geometrie der Mikrofonarrays in den Tischen als einschränkende Gegebenheit bei der dreidimensionalen Ortung von Sprechern. Für ein quadratisches Mikrofonarray wurde ein rekursives Näherungsverfahren für Azimut- und Elevationswinkel eines Sprechers entwickelt und vorgestellt.

Talk Niklas Scheutjens


nisc
Echokompensation für Meeressäuger-Klicklaute

Date: 26.10.2012, 13:00 h - 14:00 h
Room: Aquarium

Niklas Scheutjens
CAU, Kiel, Germany


Details



Meeressäuger nutzen Schall zur Navigation und Detektion von Nahrung und Feinden. Hierfür nutzen sie die Schallortung, um Informationen über ihre Umgebung zu erhalten. Diese können beispielsweise die Wassertiefe, die Entfernung zu Feinden oder der Ort von Futter sein. Dies bedeutet, dass sie nahezu kontinuierlich Töne von sich geben, die so vielfältig sind wie die Anzahl der existierenden Arten und welche zur Erkennung der Art herangezogen werden können.

Talk Niklas Scheutjens

Unter Wasser ergeben sich mehrere Einflüsse bei der Schallausbreitung. Einer davon ist die Reflexion des Schalls an der Wasseroberfläche oder anderen Sprungschichten, welcher die Auswertung des empfangenen Schalls erschwert. Um die Verarbeitung solcher Signale zu verbessern, soll während dieser Arbeit ein Satz verschiedener Kompensationsmethoden implementiert und anschlie\ss end in der Anwendung auf Unter-Wasser-Biosignale verglichen werden. Als Startpunkt der Arbeit soll eine Literatursuche die neusten/passendsten Ansätze liefern, welche nach einer Auswahl, in Matlab implementiert werden sollen. Für diese Arbeit steht eine Datenbank mit Aufnahmen verschiedener Laute verschiedener Arten, jeweils in verschiedenen Umgebungsszenarien, zur Verfügung.

Talk Lasse Joldrichsen


lajo
Echtzeitimplementierung eines frequenzselektiven Verfahrens zur Wiedergabe bewegter virtueller Quellen

Date: 20.09.2012, 13:00 h - 14:00 h
Room: Aquarium

Lasse Joldrichsen
CAU, Kiel, Germany


Details



Virtuelle Realitäten werden in unserer modernen digitalen Mediengesellschaft immer bedeutsamer. Filme und Computerspiele, die räumliches Sehen und Hören ermöglichen, gehören längst zu unserem Alltag. Unter virtuellen Existenzen sind latente Existenzen zu verstehen, welche in Form und Wirkungsweise physischen Existenzen gleichen. Solche virtuelle Realitäten haben das Ziel, durch künstliche Reize eine möglichst hohe Immersion auf Rezipientenseite zu erzielen. Zu einer perfekten Illusion der räumlichen Wahrnehmung gehört dabei nicht nur die visuelle, sondern auch die akustische räumliche Wahrnehmung. Hier kommt die virtuelle Schallquelle ins Spiel. Sie soll einem Hörer sowohl Richtung als auch Entfernung einer Schallquelle vermitteln.

Im Zuge dieser Arbeit wurden die drei Verfahren Amplitude Panning, Ambisonics und Wellenfeldsynthese, die der Synthetisierung einer virtuellen Quelle dienen, so in KiRAT implementiert, dass sich beliebig viele virtuellen Quellen auf vom Benutzer vorgegebenen Trajektorien bewegen können. Die Auswahl der Verfahren geschieht frequenzselektiv, das heißt, dass das jeweilge Verfahren mit nur einem Teilband des Eingangssignalspektrums der virtuellen Quelle angesprochen wird. Die Bandbegrenzungen der Teilbänder können durch den Benutzer gewählt werden. Eine Wiederholung der Bewegungsabläufe ist beliebig oft möglich. Auch die Lautstärke der virtuellen Quelle kann der Benutzer festlegen.

Talk Christoph Manss


chma
Analyse des Partikel-Filters unter Berücksichtigung neuester Rechnertechnologie

Date: 13.09.2012, 14:00 h - 15:00 h
Room: Aquarium

Christoph Manß
CAU, Kiel, Germany


Details



Das Kalman-Filter ist das meistgebrauchte Schätzverfahren für Trackinganwendungen. Seine Vorteile liegen in der einfachen Implementation, der Flexibilität, mit der es an die jeweiligen Probleme angepasst werden kann, und der hohen Schätzgenauigkeit. Letztere lässt jedoch nach, wenn in stark nichtlinearen Prozessen geschätzt werden soll und die Rauschprozesse nicht gaußverteilt sind. Eine mögliche Lösung für dieses Problem ist die Verwendung des Partikel-Filters. Zahlreichen Vorteilen steht bei diesem Schätzverfahren vor allem der hohe Rechenaufwand als Nachteil gegenüber. Die Berechnungen lassen sich jedoch parallelisieren, wodurch sich Berechnungsgeschwindigkeit des Partikel-Filters deutlich erhöhen kann. Die dafür nötige Anzahl an parallel arbeitenden Prozessoren liefern moderne Grafikkarten.

In dieser Arbeit wurde die Rechengeschwindigkeit und Genauigkeit einer Grafikkarten-Implementation des Partikel-Filters gegenüber einer ''normalen'' Implementation untersucht werden. Der Vortag gibt einen Überblick über die Vorgehensweise und die Ergebnisse.

Talk Florian Xaver Schmidt


fsch
Untersuchung von Detektionsalgorithmen unter Berücksichtigung neuester Rechnertechnologien

Date: 13.09.2012, 13:00 h - 14:00 h
Room: Aquarium

Florian Xaver Schmidt
CAU, Kiel, Germany


Details



Zahlreiche Trackingalgorithmen benötigen als Datenbasis sogenannte Kontaktdaten. Im Allgemeinen beinhalten Kontaktdaten mindestens Positionsangaben von potenziellen Objekten. Entsprechend müssen potenzielle Objekte vor dem Tracking detektiert werden. Neben der Möglichkeit eines einfachen Schwellwertes zur Detektion wird auch, lässt sich ein Schwellwert auch adaptiv in Abhängigkeit der Umweltbedingungen ermitteln. Einer dieser Verfahren ist der sogenannte Constant-False-Alarm-Rate Ansatz (CFAR). Neben der Detektion selbst sind zudem noch bestimmte Eigenschaften der detektierten Objekte, wie z.B. räumliche Ausdehnung, für das Tracking wichtig. Hierzu wird oftmals Methoden im Bereich des Connected-Component-Analysis (CCA, Analyse zusammenhängender Bereiche in einem Bild) benutzt. Sowohl Berechnungzeit für CFAR als auch CCA lassen sich durch parallelisierte Rechenvorgänge reduzieren.

Im Zuge dieser Arbeit wurden CFAR und CCA Algorithmen sowohl in Form von seriellen Berechnungsvorgängen auf der CPU als auch von parallelen Berechnungsvorgängen auf der GPU implementiert und im Hinblick auf Laufzeit und Rechengenauigkeit untersucht. Der Vortag gibt einen Überblick über die Vorgehensweise und die Ergebnisse.

Talk Sven Jaschke


svja
Generierung und Analyse einer Sprachdatenbank unter Berücksichtigung des Lombard-Effekts (in German)

Date: 27.08.2012, 13:00 h - 14:00 h, Room: Aquarium

Sven Jaschke
CAU, Kiel, Germany


Details (talk will be in German)



Verschiedene Arten von Stress führen dazu, dass sich die Produktion von Sprache in ihrer Lautstärke und Frequenz verändert. Typische Formen von Stress, die unsere Produktion von Sprache beeinträchtigen, sind zum Bespiel Angst, psychischer Druck oder eine laute Umgebung. Letzteres ist auch bekannt als der Lombard-Effekt, benannt nach nach dem französischen Wissenschaftler Étienne Lombard (1868-1920). Dieser Effekt beschreibt die Beobachtung, dass ein Sprecher in einer lauten Umgebung seine Lautstärke, wie auch meist seine Tonhöhe erhöht.

Um lombardische Sprache analysieren zu können, müssen vorab entsprechende Aufnahmen erzeugt werden. Dies erweist sich in einer realistischen Umgebung als eher schwierig, da vom Mikrofon nicht nur das Sprachsignal des Sprechers sondern auch das auftretende Hintergrundgeräusch aufgenommen wird. In diesem Vortrag werden zwei verschiedene Verfahren zur Aufnahme von lombardischer Sprache vorgestellt. Beide Verfahren verwenden eine reproduzierbare Geräuschsimulationen verschiedener Fahrzeuggeräusche, da im Speziellen eine Analyse des Lombard-Effektes innerhalb von Fahrzeugen in diesem Vortrag vorgestellt werden soll.

Talk David Jesch


daje
Pitch estimation of marine mammal vocalizations

Date: 31.07.2012, 13:00 h - 14:00 h
Room: Aquarium

David Jesch
CAU, Kiel, Germany


Details



Marine mammals use sound to navigate and to detect predators and prey. They use echolocation to obtain environmental information such as water depth , the location of food or the distance of objects. This means that marine mammals make use of sound almost continually. The types of sounds they use are versatile like the ammount of existing species.
During this thesis existing pitch estimation methods should be implemented and compared in unse on underwater biosignals. Therefore a literature serarch should give the upt to date estimation methods. These should be implemented under Matlab and compared to each other under the focus of robustness and calculation costs. Therefore a database with sounds of different species in different ambient noise scenarios is available. The estimation scheme with the best common performance and robustness should be implemented as a plugin for the DSS real-time framework using C.

Talk Christin Baasch


chrb
Verbesserung und Implementierung einer Geräuschschätzung in einem Echtzeitsystem für Anwendungen im Automobilbereich

Date: 09.07.2012, 10:00 h - 11:00 h
Room: Aquarium

Christin Baach
CAU, Kiel, Germany


Details



Die Entwicklung der mobilen Kommunikation war ein großer technischer Fortschritt für die Flexibilität der Gesellschaft. Einen großen Anteil an diesem Fortschritt hat die drahtlose Kommunikation mit Handy's und Satellitentelefonen. Ein Teil dieses großen Gebietes der mobilen Kommunikation ist die komfortable Kommunikation in Fahrzeugen. Anwendungen in diesem Bereich stellen Wissenschaftler und Ingenieure vor eine große Herausforderung, da diese unter schwierigen Bedingungen funktionieren müssen.

In dieser Arbeit werden, die Störungen durch Hintergrundgeräusche näher behandelt. Sie sollen geschätzt und aus dem Telefonsignal entfernt werden. Hintergrundgeräusche können in stätionärer und instationärer Natur sein. Für stationäre Geräusche, wie zum Beispiel das Motorgeräusch bei einer konstanten Drehzahl, wurden im Laufe der Zeit schon einige effiziente Algorithmen entwickelt. Das Problem bei der Hintergrundgeräuschschätzung ist die Detektion von instationären Geräuschen, wie z.B. das Öffnen eines Fensters, da diese ähnliche Eigenschaften wie Sprache haben.

Talk Rainer Martin


rainer_martin
Kompakte Repräsentation der Zeit-Frequenzstruktur von Audiosignalen für die Audioklassifikation

Date: 09.07.2012, 17:15 h - 18:15 h
Room: Aquarium

Prof. Dr.-Ing. Rainer Martin
Ruhr-Universität Bochum, Bochum, Germany


Details (talk will be in German)



Technische Systeme für die Audiokommunikation müssen neben Sprache zunehmend auch für andere Audiosignale, wie z.B. Musik oder Geräusche, geeignet sein oder diese zumindest erkennen, um spezielle Verarbeitungsverfahren auswählen zu können. Dies betrifft z.B. auch die Signalverarbeitung in Hörgeräten, die bisher vorrangig auf eine hohe Sprachqualität und Sprachverständlichkeit optimiert ist.

In diesem Vortrag werden neue Merkmale für die Audioklassifikation vorgestellt, die auf dem Modulationsspektrum des Cepstrums beruhen. Diese Merkmale werden aus einer einheitlichen Signalrepräsentation berechnet und können auf einfache Weise an die Komplexität der Klassifikationsaufgabe angepasst werden. Es wird gezeigt, wie diese Merkmale in verschiedenen Anwendungen, z.B. für die Klassifikation von Geräuschen oder musikalischen Genres, eingesetzt werden können.

Talk Rainer Martin

Weiterhin wird die Signalanalyse und die Signalsynthese mit Hilfe der "Constant-Q-Transformation" behandelt und ein neues Syntheseverfahren mit niedriger Signalverzögerung (Latenz) vorgestellt. Dieses Analyse-Synthese-Verfahren ist besonders für Musiksignale geeignet.

Talk Sebastian Rohde


ser
Untersuchung von Methoden zur Unterdrückung akustischer Rückkopplungen

Date: 14.06.2012, 14:00 h - 14:45 h
Room: Aquarium

Sebastian Rohde
CAU, Kiel, Germany


Details



In Fahrzeuginnenraumkommunikationssystemen (ICC-Systems) wird die Sprache der Passagiere über Mikrofone aufgenommen und in der gleichen akustischen Umgebung, dem Fahrzeuginnenraum, über Lautsprecher wiedergegeben. Dabei ist es unvermeidbar, dass ein Teil der Wiedergabe über direkte und indirekte Pfade im Fahrzeug auf die Mikrofone zurückgekoppelt wird.

Diese von der Systemverstärkung abhängigen Rückkopplungen können zu hörbaren Hall- und Klingeleffekten, aber auch, da es sich bei diesem System um eine geschlossene Signalschleife handelt, zur Instabilität des Systems und damit zu einem unkontrollierten Aufschwingen des Systems führen, welches als Rückkopplungspfeifen hörbar ist und sowohl die Hardware im Fahrzeug als auch die Gehörgänge der Passagiere schädigen kann.

Zur Vermeidung dieser negativen Auswirkungen der Rückkopplungen werden Algorithmen untersucht, welche das Lautsprechersignal derart verarbeiten, dass eine direkte Erhöhung der Systemstabilität erreicht werden kann und eine Unterdrückung der Rückkopplungskomponenten in den Mikrofonsignalen mittels adaptiver Filterung ermöglicht wird. Die Voraussetzung für eine erfolgreiche adaptive Rückkopplungsunterdrückung kann mit Maßnahmen geschaffen werden, welche die Lautsprechersignale untereinander sowie die Lautsprechersignale von den Quellsignalen dekorrelieren. Als primäre Verfahren werden Frequenzversatzmethoden untersucht, welche die Signale sowohl dekorrelieren als auch das System direkt stabilisieren können. Zusätzlich werden Methoden zur sog. comfort noise-Einspeisung und zur Signalsubstitution durch ein vollständig künstlich erzeugtes Signal betrachtet. Alle untersuchten Verfahren werden für die Echtzeitanwendung effizient in KiRAT implementiert und unter Gesichtspunkten der Stabilisierung, der Dekorrelierung und der auditiven Wahrnehmung evaluiert.

Talk Johann Harmstorf


jha
Aufzeichnung und Echtzeit-Verarbeitung räumlicher Audiosignale zur Reproduktion akustischer Umgebungen

Date: 14.06.2012, 13:15 h - 14:00 h
Room: Aquarium

Johann Harmstorf
CAU, Kiel, Germany


Details



In vielen Bereichen müssen elektroakustische Anwendungen evaluiert werden, um beispielsweise Algorithmen auf ihre Tauglichkeit zu testen. Dabei kann ein Durchlaufen eines sehr breiten Spektrums von akustischen Szenarien sinnvoll oder notwendig sein. Dabei ist es wünschenswert, die Evaluierung der elektroakustischen Anwendungen in einem kontrollierten und reproduzierbaren Rahmen durchzuführen, denn so können Fortschritte verfolgt und Probleme besser analysiert werden.

Das Ziel dieser Arbeit war es, ein Wiedergabesystem zur Reproduktion akustischer Umgebungen zu entwickeln. Dabei wurde der Ansatz des inversen Beamformings verfolgt. Im Rahmen dieser Arbeit wird dazu ein Wellenfeld mit einem Mikrofon-Array aufgenommen. Von einem Beamformer-Array wird dann der gesamte Azimuth-Bereich abgetastet. Um sicherzustellen, daß jede Quelle mit demselben Leistungsdichtespektrum in den Beams repräsentiert wird, mit dem sie von einem Mikrofon empfangen wurde, wird anschließend das Leistungsdichtespektrum der Beams auf das von den Mikrofonen empfangene Leistungsdichtespektrum normiert. Danach wird durch ein Schärfungsfilter die spektrale Leistung zwischen den Beams umverteilt. Diese Umverteilung arbeitet wiederum leistungserhaltend.

Die so berechneten Beams werden dann räumlich auf das vorhandene Lautsprecher-Setup entzerrt und wiedergegeben.

Weiterhin wurde auf Grundlage der Farina-Methode zur Messung von Impulsantworten eine Methode entwickelt, um mittels eines Mikrofon-Arrays direktionale Impulsantworten zu messen.

Talk Maria Glukhova


magl
Automatic Evaluation of In-Car Communication Systems within a Real-Time Framework (in English)

Date: 31.05.2012, 13:30 h - 14:00 h
Room: Aquarium

Maria Glukhova
CAU, Kiel, Germany


Details



The aim of an In-Car Communication system (ICC system) is to improve the impaired communication situation within a vehicle. The Impairment occurs due to an increased background noise level, originating from an incrementation of the velocity, and the fact the the passengers are talking towards the windshield. The main idea of an ICC system is to record the speech signal of the talking passenger via microphones and play back this speech signal, after some signal enhancement, via the loudspeakers located nearby the listening passenger.

After the development of such the system the question arises, how well does such a system actually work. Besides there are up till now no standards for evaluation published or settled yet. Therefor, the aim of this thesis was, to find some first methods to evaluate an ICC system. This can for example be done by applying already known evaluation standards from different application and analyzing the quality of these standards within the given scenario. As well as the evaluation of the single components of an ICC system might be of interest to evaluate an ICC system.

Talk Michael Brodersen


mibr
Analyse von Mikrofonsignalen und automatische Mikrofonkalibrierung

Date: 23.05.2012, 10:00 h - 10:45 h
Room: Chair library

Michael Brodersen
CAU, Kiel, Germany


Details



Talk Michael Brodersen Moderne Kraftfahrzeuge sind häufig mit Mikrofonen ausgestattet. Diese Mikrofone werden für die Freisprecheintrichtung oder in Fahrzeuginnenraumkommunikationssystemen (In-car communication, ICC) genutzt. Unter den Mikrofonen existieren Fertigungstoleranzen, welche sich zum Beispiel in verschiedenen Frequenzgängen bemerkbar machen. Ebenso verändern sich bei der Alterung der Mikrofone deren Eigenschaften. Außerdem können Fehler im Signal durch die Hardware hervorgerufen werden.

Aus diesem Grund werden die Mikrofonsignale auf deren Merkmale im Zeitbereich hin untersucht um beispielsweise den Ausfall oder das Übersteuern eines Mikrofons zu detektieren. Um die Unterschiede der Mikrofone zu minimieren, wird zudem eine Mikrofonkalibrierung im Frequenzbereich durchgeführt.

Um mehr Mikrofone für das ICC-System des Versuchskraftfahrzeugs einer Mercedes S-Klasse nutzen zu können, werden zusätzlich fünf Mikrofon-Arrays eingebaut.

Talk Befkadu Temesgen Gebru


betg
Automated Quality Assessment of Text-to-Speech Signals Using Acoustic Markers (in English)

Date: 10.05.2012, 13:00 h - 14:00 h, Room: Aquarium

Befkadu Temesgen Gebru
CAU, Kiel, Germany


Details (talk will be in English)



In today's competitive environment, perceived speech quality of Text-to-Speech (TTS) signals is the main criterion for the customers to judge the Quality of Service (QoS). In this thesis work different speech signal analysis methods are tested in an effort to develop objective TTS-signal quality estimators. The effect of signal degradation on short-term and long-term temporal dynamics of the TTS signals are captured to derive quality measures. Furthermore, irregularities in the periodicity of the TTS signals is analyzed with general variogram analysis. Finally, cross-validated feature selection using the data from the quality measures obtained is developed in an effort to build non-intrusive TTS-signal quality estimators.

Talk Friedemann Köster


fko
Instrumentelle Schätzung prosodischer Qualität für synthetisierte Sprachsignale (in German)

Date: 03.05.2012, 13:00 h - 14:00 h, Room: Aquarium

Friedemann Köster
CAU, Kiel, Germany


Details (talk will be in German)



Die vorliegende Diplomarbeit hat das Ziel, Parameter zu finden, mit denen die wahrgenommene prosodische Qualität von synthetischen Sprachsignalen, die mit Text-To-Speech(TTS)-Systemen erstellt worden sind, instrumentell geschätzt werden kann. Zu diesem Zweck werden mit mehreren Verfahren prosodische Parameter der Sprachsignale bestimmt. Nach verschiedenen Vorverarbeitungsmethoden wie der Medianglättung werden aus diesen prosodischen Parametern unterschiedliche Parameter extrahiert. Zunächst werden diese Parameter auf ihre Korrelation mit Qualitätswerten von vorhandenen TTS-Datenbanken überprüft. Anschließend wird mit einem Lernverfahren und einem Regressionsmodell die wahrgenommene Qualität geschätzt und eine Parameterauswahl bestimmt. Abschließend werden aus dieser Parameterauswahl die Parameter selektiert, mit denen die wahrgenommene Qualität von synthetischen Sprachsignalen bestmöglich und robust geschätzt werden kann.

Talk Sönke Heidkamp


shei Implementierung eines Echtzeitsystems zur Bandbreitenerweiterung von schmalbandigen Sprachsignalen (in German)

Date: 26.04.2012, 13:00 h - 14:00 h, Room: Chair library

Sönke Heidkamp
CAU, Kiel, Germany

Details (talk will be in German)


Obwohl wir uns im digitalen Zeitalter befinden, wird bei der Telefonie, vor allem bei der mobilen Verwendung, nach wie vor auf analoge Übertragungsverfahren zurückgegriffen. Dies bedingt eine Begrenzung der Bandbreite des Signals und führt zu dem typischen Klang eines Telefongesprächs. Da sich dieser Umstand nicht in absehbarer Zeit ändern wird, ist es erforderlich durch geeignete Maßnahmen das originale Signal zu rekonstruieren.

Talk Sönke Heidkamp

Im Rahmen des Vortrages wird gezeigt, wie sich dieses Problem in die beiden Komponenten vokales Anregungssignal und Hüllkurve zerlegen lässt. Zur spektralen Erweiterung des vokalen Anregungssignals werden nichtlineare Operationen verwendet. Die korrespondierende breitbandige Hüllkurve kann mithilfe eines Codebuches geschätzt werden. Zur Reduktion der Komplexität wird hierfür die Frequenz in Mel skaliert.

Talk Oliver Lange


oliver_lange
Richtungsschätzung mit optimalen Antennen-Arrays für automobile Radarsysteme (in German)

Date: 02.04.2012, 17:15 h - 18:15 h
Room: Aquarium

Oliver Lange
Robert Bosch GmbH, Hildesheim, Germany


Details (talk will be in German)



Radarsensoren im Automobil werden zur Umfelderfassung genutzt und bilden die Basis für Fahrerassistenzfunktionen wie dem adaptiven Folgefahren und Sicherheitsfunktionen wie der automatischen Notbremsung. Dabei wird die Straßenszene aktiv durch den Sensor ausgeleuchtet und anhand der reflektierten Signale der Abstand, die Relativgeschwindigkeit und die Richtung (Winkel) von kollisionsrelevanten Objekten geschätzt. Ein Antennenarray mit anschließender digitaler Signalverarbeitung stellt dabei eine vielversprechende Ausführungsform zur Richtungsschätzung dar. Der Vortrag befasst sich mit der Optimierung der Geometrie von Radar-Antennen-Arrays mit dem Ziel, die Güte der Richtungsschätzung zu verbessern. Die Optimierungskriterien werden dazu aus der entsprechenden Signalverarbeitung sowie theoretischen Grenzen abgeleitet. Das enorme Potenzial der Optimierung ermöglicht die Konstruktion von kostengünstigen aber hochgenauen Radar-Imaging-Systemen. Es werden u.a. Simulationen und Messergebnisse eines bildgebenden Radars präsentiert.

Talk Moritz Dechert


md
Optimierung der Signalwiedergabe von kommunikationsunterstützenden Systemen in Fahrzeugen (in German)

Date: 16.02.2012, 13:00 h - 14:00 h
Room: Aquarium

Moritz Dechert
CAU, Kiel, Germany


Details (talk will be in German)



Bei der Signalwiedergabe vonMusiksignalen in Fahrzeugen mit hochwertiger Audioausstattung wird heute bereits ein großer Aufwand im Sinne einer frequenzselektiven Anpassung des Betragsfrequenzgangs und der Gruppenlaufzeit (des Phasengangs) betrieben. Für die Wiedergabe von Sprachsignalen - beispielsweise das Signal des fernen Gesprächpartners bei Freisprechtelefonen oder das Signal des sprechenden Passagiers bei Innenraumkommunikationsssytemen - wird derzeit nur sehr wenig in den Signalweg eingegriffen. Im Rahmen einer Bachelorarbeit sollen daher für ein bestehendes Audio-Echtzeitsystem der Universität Kiel die Möglichkeiten der Betrags- und Phasenanpassung untersucht werden.

Hierzu sind vor allem Messungen zwischen den einzelnen Lautsprechern eines Fahrzeugs und den Ohren durchzuf¨uhren und basierend auf den Ergebnissen zum einen qualitätsverbesserunde und zum anderen rückkopplungsunterdrückende Ansätze auszuprobieren. Diese Ansätze sollen sowohl mittels einer Fahrgeräuschsimulation im hallarmen Audiolabor hier in Kiel als auch im Fahrzeug mit Versuchspersonen verifiziert werden.

Talk Nicklas Eiselt


ne
Entwicklung und Aufbau mehrdimensionaler Mikrofon-Arrays zur Echtzeit-Sprachverbesserung mittels Beamforming

Date: 19.01.2012, 13:00 h - 13:30 h
Room: Aquarium

Nicklas Eiselt
CAU, Kiel, Germany


Details (talk will be in German)



Mit einem Mikrofon werden Schallwellen erfasst und in ein elektrisches Signal umgewandelt. Werden mehrere Mikrofone in einem Raum angeordnet, so erfasst jedes Mikrofon die Schallwelle zu unterschiedlichen Zeitpunkten. Jedes einzelne Mikrofonsignal ist damit zeitlich zu den anderen Mikrofonen verschoben.Wird nun diese zeitliche Verschiebung bestimmt und die Phase der Signale durch einen komplexen Faktor angeglichen, so sind sie in Phase. Ein Summation dieser Mikrofonsignale führt also zu einer Verstärkung. Werden dagegen Signale aus anderen Richtungen mit diesem Faktor multipliziert, so sind diese nicht in Phase. Eine Aufsummation ist damit destruktiv, sodass diese Signale gedämpft oder sogar eliminiert werden. Demnach kann durch das Ausnutzen von räumlichen Informationen ein Signal gezielt von anderen Signalen getrennt werden. Talk Nicklas Eiselt Signale die gezielt durchgelassen werden, stellen Nutzsignale dar; Signale die gedämpft werden, sind Störsignale. Die Anordnung von Mikrofonen im Raum wird in dieser Arbeit als Mikrofon-Array bezeichnet. Das gezielte Beeinflussen der Richtcharakteristik eines Mikrofon-Arrays wird Beamforming genannt, die Einheit, die diese Richtcharakteristik ermöglicht, heißt Beamformer.

In dieser Arbeit geht es darum die Eigenschaften von bestimmten Mikrofonanordnungen anhand von Simulationen zu bestimmen und eine Geometrie schließlich für ein bereits vollständig implementiertes Echtzeit-Beamformer-Nachfilter-System aufzubauen. Der Fokus der Anwendung liegt dabei auf der automobilen Umgebung. Die Nutzsignale sind Sprachsignale; im Auto kann dies z.B. der Autofahrer sein. Zu den Störsignalen zählen ebenso Sprachsignale, z.B. der Beifahrer, aber auch Rauschen und andere Störgeräusche wie z.B. Fahrgeräusche.

Talk Bernd Iser


bernd_iser
Sprachsignalverarbeitung im Fahrzeug: Heute und morgen (in German)

Date: 09.01.2012, 17:15 h - 18:15 h
Room: Aquarium

Dr.-Ing. Bernd Iser
SVOX Deutschland GmbH / Nuance, Ulm, Germany


Details (talk will be in German)



In den letzten Jahren eroberten Multimediaanwendungen verstärkt auch die automotive Umgebung. Dadurch gewinnt auch die Sprachsignalverarbeitung an Bedeutung. Heute ist ein Auto ohne Radio, CD-, MP3-Player, Navigation und Freisprecheinrichtung nicht mehr denkbar.

Auch die Sprachbedienung solcher Komponenten gehört in einigen Fahrzeugklassen bereits zur Standardausstattung. Darüber hinaus befinden sich zukunfstsweisende Anwendungen wie z.B. Innenraumkommunikation, Mehrplatztelefonie oder active noise control in der Entwicklung. Der Vortrag spannt den Bogen von den klassischen Sprachsignalverarbeitungsanwendungen und ihren Komponenten, wie sie z.B. beim Freisprechen in Form eines Echokompensators oder einer Geräuschreduktion auftreten, bis hin zu Innenraumkommunikationssystemen und den damit verbundenen Schwierigkeiten der Sprachsignalverarbeitung in einer geschlossenen elektro-akustischen Schleife. Der Fokus des Vortrags liegt dabei auf den Problemstellungen die sich aus den jeweiligen Anwendungen und den Rahmenbedingungen ergeben sowie deren prinzipiellen Lösungsansätzen.