Digital Signal Processing and System Theory

Talk Jan Bajorat


jan_bajorat
Implementierung eines Sprachverbesserungssystemes mit mehreren Mikrofonen

Date: 01.06.2011, 10:00 h - 11:00 h, Room: Aquarium

Jan Bajorat
CAU, Kiel, Germany


Details



In vielen Anwendungsgebieten besteht der Wunsch, ein gewünschtes Signal von unerwünschten Störungen zu trennen. Das Nutzsignal soll ein verarbeitendes System möglichst ungestört passieren, während Störsignale maximal gedämpft werden. Besitzen Nutz- und Störsignal potentiell gleiche Frequenzcharakteristiken, so ist eine Trennung aufgrund dieser Frequenzcharakteristiken nicht möglich. Sind die Zeiträume, in denen ein Nutz- bzw. Störsignal vorliegt, im Voraus nicht bekannt, so ist eine Trennung basierend auf zeitlichen Kriterien ebenfalls nicht möglich. Oftmals sind jedoch räumliche Informationen über das Nutzsignal bekannt, d. h. Signale aus einer bestimmten Richtung gelten als Nutzsignal. Mit der Verwendung eines einzelnen Sensors ist es unmöglich, diese räumlichen Informationen auszunutzen. Werden allerdings mehrere, räumlich getrennte Sensoren in einem sogenannten Array verwendet, so ist es möglich, mit Hilfe dieses Arrays Richtungsabhängigkeiten des Gesamtsystems auszuprägen. Die gezielte Beeinflussung der Richtcharakteristik eines Mikrofon-Arrays wird Beamforming genannt.

talk_2011_jan_bajorat

Beamforming wird in so unterschiedlichen Bereichen wie Radar, Geophysik und Akustik angewendet. Die verwendeten Sensoren sind je nach Anwendungsgebiet unterschiedlich, was sowohl ihre Charakteristiken als auch ihre mögliche Positionen und Abstände angeht. Auch die benötigte Bandbreite der Signale ist je nach Anwendungsgebiet unterschiedlich. Oftmals ist es wünschenswert, die Richtcharakteristik des Arrays ändern zu können, ohne die Sensoren bewegen zu müssen.

In dieser Arbeit geht es um die Implementierung eines Beamformer- und Nachfilter-Systems zur Sprachverbesserung. Die verwendeten Sensoren sind deshalb Mikrofone. Nutzsignale sind Sprachsignale eines oder mehrerer Nutzer, welche aus einer gewünschten Richtung kommen. Zu den Störsignalen zählen unter anderem Sprachsignale aus anderen Richtungen, welche von Störsprechern stammen. Das gesamte System soll in Hinblick auf seine Zielanwendung in einer automobilen Umgebung ausgelegt sein. Zu den Hauptproblemen gehören dabei:

  • Das Nutzsignal (Sprache) ist extrem breitbandig. Wird eine gute Qualität des Sprachsignals angestrebt, ist der zu betrachtende Frequenzbereich etwa 100- 5000 Hz. Dabei befindet sich der Hauptteil der Energie im tiefen Frequenzbereich bis ca. 1000 Hz.
  • Das gesamte System muss in Echtzeit arbeiten. Dies erfordert recheneffiziente Algorithmen und Verfahren.
  • Es gibt viele verschiedene Störsignalquellen. Diese sind im Allgemeinen nicht nur zeitvariant, auch die Positionen der Störsignalquellen sind im Voraus nicht bekannt.