Digital Signal Processing and System Theory

Talk Celina Schneider


cesc

Evaluation of Speech Enhancement Algorithms

Date: 20.11.2013, 11:30 h - 12:30h
Room: Aquarium

Celina Schneider
CAU, Kiel, Germany,




Details



Heutzutage übernimmt die digitale Übertragung von Sprache immer mehr Relevanz. In vielen Ger¨aten werden Algortihmen implementiert, die die Sprachverständlichkeit verbessern und somit nicht nur einen höheren Komfort bietet, sondern auch mehr Sicherheit, da zum Beispiel im Auto der Fahrer sich bei einer Unterhaltung nicht mehr umdrehen muss. Die Aufgabe von Sprachbearbeitungs-Algortihmen besteht in vielen Anwendungen darin eine Geräuschunterdrückung zu erzielen oder die Verbesserung der Sprachverständlichkeit im Allgemeinen umzusetzen. Der Lehrstuhl für Digitale Signalverarbeitung und Systemtheorie befasst sich unter anderem mit Verbesserung der Kommunikation in Kraftfahrzeugen. Dazu steht eine S-Klasse in der long Version der Marke Mercedes Benz zur Verfügung. In diesem Fahrzeug sind verschiedene Mikrofone und Lautsprecher eingebaut, die für den Anwendungsbereich des Freisprechens und der Fahrzeuginnenraumkommunikation Verwendung finden. Zur Optimierung der Fahrzeuginnenraumkommunikation, auf englisch In-car communication (ICC), hat die Arbeitsgruppe schon einige Erfolge erzielen können. Das ICC System dient zur Verbesserung der Kommunikation in einem fahrenden Auto. Dazu sind die Lautsprecher an den Fahrzeugtüren und in der Hutablage eingearbeitet. Bei den verwendeten Mikrofonen handelt es sich um Gurtmikrofone, die von einer externen Firma namens Paragon eigens hergestellt wurden. Dabei sind die Mikrofone in den Sicherheitsgurt mit eingewebt worden. Weiterhin befasst sich der Lehrstuhl für Digitale Signalverarbeitung und Systemtheorie mit der Verbesserung der Kommunikation von Einsatzkräften der Feuerwehr, während sie eine Atemschutzmaske tragen und in einem Einsatz tätig sind. Die Kommunikation während eines Einsatzes erweist sich als äußerst problematisch. Die Kommunikationseinheit ist in diesem Fall direkt an die Atemschutzmaske gekoppelt. Sie befindet sich an der Sauerstoffzufuhr, sodass nicht nur die Umgebungsgeräusche ein wichtiger Störfaktor sind, sondern auch das Ein- und Ausatmen einen sehr großen Bestandteil der Störgrößen darstellen. Eine Atemschutzmaske ist demnach nicht nur mit der wichtigen Sauerstoffzufuhr und wichtigen Filtern ausgestattet, sondern auch mit zwei Lautsprechern und einem Mikrofon. Die Lautsprecher sind außen an der Atemschutzmaske angebracht, sodass ein Feuerwehrmann/frau ohne einen Funkpfad kommunizieren kann. Dies ist besonders wichtig, wenn mit einem Verletzten bzw. mit einem Opfer gesprochen wird und somit vergleichbar mit einer Freisprecheinrichtung eines Autos ist.

Nach der Umsetzung dieser Systeme stellt sich die Frage, inwiefern sich die Qualtität eines solchen Sprachverbesserungssystems bestimmen lässt. Dies wird das Ziel dieser Bachelorarbeit darstellen. Eine M¨oglichkeit wäre verschiedene Probanden Audiodatein, die einen Sprachverbesserungsalgorithmus durchlaufen haben und welche die keinen durchlaufen haben, vorzuspielen und nach eigenem Empfinden subjektiv bewerten zu lassen. Die zweite Variante wäre, anhand einer objektive Methode die Systeme zu evaluieren. Dazu würden verschiedene Methoden in Matlab implementiert, dann die Distanzen berechnet werden und nach eigener Erwartung bei einem optimalen Algorithmus würde die Distanz möglichst klein bleiben. Eine weitere Möglichkeit einen Sprachverbesserungsalgorithmus zu evaluieren, wäre die Betrachtung des Verhältnisses von Sprache und Rauschen (SNR) der Signale vor und nach dem Sprachverbesserungsalgorithmus. Der Hauptaugenmerk dieser Bachelorarbeit wird dabei auf dem In-car-communication System liegen.