Digital Signal Processing and System Theory

Parkinson Sprachsignal Analyse

Morbus Parkinson

Die Parkinsonkrankheit (Morbus Parkinson) ist eine langsam fortschreitende neurodegenerative Erkrankung. Dabei handelt es sich um eine meist langsam fortschreitende, erblich oder sporadisch auftretende Erkrankung des Nervensystem. Der Morbus Parkinson ist gekennzeichnet durch das vornehmliche Absterben der dopaminproduzierenden (Glückshormone) Nervenzellen in der Substantia nigra (Struktur im Mittelhirn). Man muss dazu sagen, dass die Erkrankung nicht sofort auftaucht, sondern erst nach dem 55%-60% dieser Zellen abgestorben sind. Die typischen Leitsymptome machen sich bemerkbar durch: Muskelstarre, verlangsamte Bewegung bis hin zur Bewegungslosigkeit, Muskelzittern und Haltungsinstabilität. Nicht zu unterschätzen sind die psychischen Veränderungen, die für die Patienten im Alltag eine große Herausforderung darstellen, welche aber natürlich nicht so augenfällig sind wie die motorischen Phänomene.

  • Niedergedrückte Stimmung (Schon Jahre vorher bei 40 % der Patienten)
  • Verlangsamter Denkablauf
  • Störung beim Einschätzen von Geschwindigkeiten und Entfernung
  • Sinnestäuschung durch das Einnehmen von Dopamin-Ersatz

 

Motivation

Menschen, die unter Morbus Parkinson leiden (89%), haben oder entwickeln Probleme beim Sprechen.

Wie macht sich das bemerkbar?

  • Leise Stimme
  • Verwaschene Aussprache
  • Monotone Sprechweise
  • Heisere Stimme
     

Die Grundidee des Projekts ist also die Analyse von Sprachsignalen von Parkinson erkrankten Menschen mit Hilfe einer selbst erstellten Homepage.  Diese Sprachsignale liegen als Wave-Dateien vor, die in einer Datenbank hinterlegt werden. Diese Datenbank wird in die Homepage implementiert, wobei das Grundgerüst der Homepage vorgegeben ist. Je nach dem wofür man sich entscheidet, kann man beliebige Sprachsignale aufrufen und analysieren. Die Analysen beschränken sich auf das Spektrogramm und das Leistungsdichtespektrum. Das Ziel so einer Analyse liegt darin, den Medizinern die Möglichkeit zu geben durch die Analysen bestimmte Informationen zu entnehmen, die zur Verbesserung vielleicht aber auch zur kompletten Heilung der Krankheit führen können.

Die studierenden sollen folgende Kapazitäten erreichen:

  • Zuvor erlernte Fähigkeiten in der Signalverarbeitung (Vorlesung Signale und Systeme I,II) auf Problemstellungen eigenständig anzuwenden.
  • Die Fähigkeit, MATLAB zu verwenden, für Signalverarbeitungsaufgaben und den Umgang mit SVN zu erlernen.
  • Die Einteilung des Teams und somit große Problemstellungen in kleinere Einzelaufgaben aufzuteilen.
     

Analysen

In dem Projekt werden Sprachsignale analysiert indem man das Spektrogramm und das Leistungsdichtespektrum erzeugt. Die folgende Abbildung zeigt ein solches Beispiel.

Zwei Studenten und eine Tasse Kaffee

 

Das erste Bild zeigt das Sprachsignal: Die Zeit ist auf der x-Achse aufgetragen und die y-Achse stellt die dB-Kennlinie dar.  An den blauen Linien (Parallel zur dB-Achse) kann man gut erkennen, dass der Patient spricht. Umso höher die blauen Linien nach oben gehen umso lauter spricht er. Mithilfe eines Mikrofons wird die Sprache in ein elektrisches Signal umgewandelt. Das elektrische Signal wird abgetastet und die Werte zum Abtastzeitpunkt gespeichert. Das Sprachsignal spiegelt den Satz „ Der Mann hat geschwankt“ wider.

Darunter befindet sich das Spektrogramm. Die Zeit ist wiederum auf der x-Achse aufgetragen und die y-Achse gibt die Frequenz wieder. Das Spektrogramm stellt das Frequenzspektrum (Anteile der jeweiligen Frequenzen) eines Signals bildlich dar.

In der Regel wählt man Rot für eine hohe Amplitude, Violett für eine tiefe (dazwischen Orange, Gelb, Grün, Blau), keine Färbung, wenn der Wert unter einem vorgegebenen Pegel liegt. Hier wird auch dargestellt, wie sich das Frequenzspektrum über die Zeit ändert. Dafür wurde die Kurzzeit-Fourier-Transformation verwendet. Das Signal wurde mit Hilfe der Hamming-Fensterfunktion aufgeteilt und überlappend dargestellt, wodurch eine Spalte ca. 0,1045 s lang ist. In der Frequenz-Achse entsteht alle 512 Hz ein neuer Balken.

Das letzte Bild zeigt das Leistungsdichtespektrum. Da es keine Fouriertransformierte für Funktionen von ergodischen Prozessen gibt und somit keine Aussagen über die Frequenzverteilung machen kann, definiert man sich ein Leistungsdichtespektrum, das die Verteilung der Leistung des Signals als Funktion der Frequenz liefert. Aus dem Leistungsdichtespektrum kann man im Gegensatz zu der normalen Fouriertransformierten das Ausgangssignal nicht zurückgewinnen. Mathematisch ist das Leistungsdichtespektrum die Fourier-Transformierte der Autokorrelationsfunktion.

Kontakt

Bei Interesse an diesem Bachelorprojekt kontaktieren Sie bitte:

Prof. Dr.-Ing. Gerhard Schmidt

M.Sc. Christin Baasch