Digital Signal Processing and System Theory

Talk Gerhard Schmidt


gerhard_schmidt
Sprachsignalverarbeitung für die Mensch-zu-Mensch- und die
Mensch-zu-Maschine-Kommunikation


Date: 12.07.2010, 17:15 h - 18:15 h (talk will be in German)
Room: Aquarium

Prof. Dr.-Ing. Gerhard Schmidt
Christian-Albrechts-Universität zu Kiel


Details



talk_2010_gerhard_schmidtIn den letzten Jahren wurden sowohl Freisprech- als auch Sprachdialogsysteme deutlich verbessert. Frühere Systeme waren durch die zur Verfügung stehende Rechenleistung bzw. durch die verfügbare Speichermenge recht eingeschränkt und konnten deshalb nur einfache Signalverbesserungsalgorithmen einsetzen. In den heutigen Systemen werden adaptive Filter wie beispielsweise Echokomensationsfilter, Geräuschunterdrückungsfilter und Mehrmikrofonsignalverarbeitungen (Beamforming) - um nur einige Algorithmen zu nennen - verwendet. Damit kann eine deutlich bes-sere Signalqualität erreicht werden. Neben diesen "konventionellen" Ansätzen gibt es aber noch zahlreiche algorithmische Möglichkeiten, die weitere merkliche Verbesserungen der Qualität der Sprachkommunikation zulassen. Beispiele für solche Anwendungen von erweiterten Algorithmen sind
5px_blank
  • Qualitätsverbesserungen für die Empfangssignale von Freisprecheinrichtungen,
  • modellbasierte Ansätze zur Rekonstruktion von sehr stark gestörten Signalanteilen und
  • Verbesserungen der Kommunikationsqualität im Fahrzeug (Gespräche zwischen den Passa-gieren innerhalb eines Fahrzeugs).

Bei all diesen erweiterten Ansätzen zur Sprachverbesserung werden sog. Sprachsignalmodelle verwendet. Diese müssen entweder zuvor auf der Basis einer großen Datenmenge trainiert oder besser noch mit aufgenommenen Daten während des Betriebs eines Sprachverbeserungssystems erzeugt werden. In diesem Vortrag werden einige dieser Forschungstrends beschrieben, deren Umsetzungen gezeigt und erste Ergebnisse vorgestellt, die mit realen Systemen in Echtzeit erzeugt wurden.