Stimmenanalyse und Filterung von Geräuschen


Stimmenvergleich bzw. Stimmenanalyse und Filterung von Hintergrundgeräuschen

Beschreibung der Methoden

Bei meiner langjährigen Tätigkeit als Gutachter für mehrere Behörden (Gerichte, Staatsanwaltschaften, OK-Dienststellen) in verschiedenen Bundesländern, traten oft Probleme bezüglich der fehlerfreien Auswertung von aufgezeichneten Sprachsignalen auf. Ursache für solch erschwerte Auswertung bei der Sprachübertragung waren dominierende Hintergrundgeräusche, die teilweise die Sprache völlig überdeckt haben. Solche Situationen treten meistens bei einer Sprachübertragung aus einem bewegten Transportmittel auf oder wenn die Übertragung mit Musik und sonstigen Nebengeräuschen überlagert ist (z.B. 100c Maßnahmen).
Außerdem trat oft die Frage auf, ob zwei Stimmen identisch sein können oder nicht.



Dies war für mich der Anlass, zwei computerunterstützte Verfahren bzw. Computerprogramme, für eine bessere Auswertung von Sprachübertragungen und zur Stimmenanalyse bzw. Stimmenvergleiche zu entwickeln. Das eine Verfahren ermöglicht es, Hintergrundgeräusche herauszufiltern und dadurch die aufgezeichnete Sprachübertragung besser auszuwerten. Das andere Verfahren erlaubt die Überprüfung zweier Stimmen auf Identität oder Nicht-Identität (Stimmenanalyse bzw. Stimmenvergleich).



Grundlage für beide Verfahren (Filterung von Hintergrundgeräuschen und Stimmenanalyse) ist, dass die menschliche Stimme als eine eindimensionale Struktur aufgefasst wird und so neue Erkenntnisse und Verfahren aus der Realstrukturforschung und Signalverarbeitung bzw. Spektralanalyse angewandt werden können. Bei dieser Bearbeitungsmethode wird das Sprachsignal bzw. die Sprachstruktur als Realstruktur betrachtet. Im Frequenzraum enthält eine Realstruktur periodische und diffuse Anteile.
Die Störung beim Auftreten von Hintergrundgeräuschen in der Stimmaufzeichnung ist durch die Überlagerung mit Rauschkomponenten verursacht. Durch mehrere Entfaltungsoperationen wird erreicht, dass die Rauschkomponenten aus der Realstruktur (verrauschte Stimme) entfernt werden, möglichst ohne eine Stimmverfälschung herbeizuführen.



Diese Betrachtungsweise von aufgezeichneter Sprache als Struktur bzw. Signal erlaubt auch, die Struktur der Stimme zu definieren und zu charakterisieren. Denn das digitalisierte Sprachsignal (bzw. die Sprachstruktur) beinhaltet sämtliche Merkmale der Stimme. Durch physikalisch-mathematische Methoden werden die Stimmmerkmale aus der Stimmentruktur extrahiert, um anschließend ein Stimmprofil zu berechnen. Auf diese Art können Stimmenvergleiche durchgeführt werden. Voraussetzung dafür ist eine weitgehend ungestörte Sprachaufzeichnung.
Nachfolgend werden die Methoden kurz beschrieben:

- Störsignale filtern bzw. unterdrücken bei Sprachübertragung (Telefon, Handy und sonstige Sprachübertragungsmethoden)

- Stimmenanalyse (stimmenvergleichendes Gutachten)

Ich hoffe, Ihnen damit einen kurzen Überblick über die Einsatzmöglichkeiten der Methoden gegeben zu haben und bin zuversichtlich, dass meine Dienstleistung Ihr Interesse findet. Für weitere Informationen oder Fragen stehe ich Ihnen gerne zur Verfügung.

Prof. Dr. Sameh Rahman