Wie die Sprecheridentifikation die Erkennung von Emotionen beeinflusst

Wie sich die Sprecheridentifikation auf die Erkennung von Emotionen auswirkt

Tags: Emotionserkennung, Forschung, technologie

Mai 14, 2021,

Caro Bauer

Sprache ist ein sehr persönliches und leistungsfähiges Kommunikationsmedium, das viele einzigartige Informationen und Eigenschaften enthält. Diese Informationen ermöglichen es Softwareanbietern, sie in konkreten Anwendungsszenarien wie der Emotionserkennung zu nutzen. Die Identifizierung des Sprechers ist ein wichtiger Bestandteil sprachbasierter Technologien wie der Sprach- und Sprecherkennung. Sie kann einzigartige Informationen wie Geschlecht und Alter liefern. Wie kann sie also eine Technologie wie die Erkennung von Emotionen anhand von Sprache beeinflussen?

Vorteile der Sprecheridentifikation

Aufgrund der Individualität jedes einzelnen Menschen hat auch jede Stimme individuelle Merkmale, die nur diese einzigartige Person hat. Die derzeitige Sprach- und Emotionserkennung leidet unter der Variation der Stimmcharakteristika. Um für jede Person das beste Ergebnis zu erzielen und dieses Problem im Rahmen zu lösen, wenden wir die Sprecheridentifikation an.

"Durch die Sprecheridentifikation kann unsere Technologie zur Emotionserkennung besser und genauer arbeiten. Die sprecherabhängige Technologie ermöglicht genauere Ergebnisse als die sprecherunabhängige Technologie, weil wir auf die Eigenschaften der Sprecher eingehen können", sagt Prof. Dr. Felix Burkhardt, Forschungsleiter bei audEERING.

Selbstlernende KI passt sich Sprechern an

Auf lange Sicht würden jedoch wichtige Informationen über die Eigenschaften des Sprechers verloren gehen, sobald verschiedene Personen das Lautsprechersystem benutzen. Aus diesem Grund sollte es mit einer selbstlernenden Technik kombiniert werden, um die Selbstlernfähigkeit des Systems zu verbessern. Es wird ein Sprecheranpassungsschema für eine schnelle kurzfristige und eine detaillierte langfristige Anpassung eingeführt. Diese Anpassungsprofile werden dann für ein effizientes Sprechererkennungssystem verwendet und ermöglichen der Sprecheranpassung, verschiedene Sprecher zu verfolgen. Auf lange Sicht bietet dieser Ansatz eine optimale Anpassung.

Der Datenschutz muss gewährleistet sein

Datenschutz ist für uns von zentraler Bedeutung und muss beim Einsatz von künstlicher Intelligenz immer gewährleistet sein. Als deutsches Unternehmen arbeiten wir nach der Allgemeinen Datenschutzverordnung (GDPR) und dem Telemediengesetz (TMG), so dass keine Daten auf fremden Servern gespeichert werden. Darüber hinaus hat der Nutzer jederzeit die Möglichkeit, alle seine Daten zu löschen. Sie können diese Regel sehr transparent in unserer COVID-19 Studie auf unserer Aufnahmeplattform AI SoundLab sehen.