Startseite " Veröffentlichungen " Sind Sie sicher? Analyse von Unsicherheitsquantifizierungsansätzen für die Erkennung von Sprachemotionen in der realen Welt
2024
Oliver Schr¨ufer, Manuel Milling, Felix Burkhardt, Florian Eyben, und Björn Schuller
Die Quantifizierung der Unsicherheit (Uncertainty Quantification, UQ) ist ein wichtiger Baustein für den zuverlässigen Einsatz neuronaler Netze in realen Szenarien, da sie ein nützliches Instrument zur Erkennung fehlerhafter Vorhersagen sein kann. Modelle zur Sprach-Emotionserkennung (SER) können unter besonders vielen Unsicherheitsquellen leiden, wie z.B. der Mehrdeutigkeit von Emotionen, Out-of-Distribution (OOD)-Daten oder allgemein schlechten Aufnahmebedingungen. Zuverlässige UQ-Methoden sind daher von besonderem Interesse, da in vielen SER-Anwendungen keine Vorhersage besser ist als eine fehlerhafte Vorhersage. Während die Auswirkungen von Label-Ambiguität auf die Unsicherheit in der Literatur gut dokumentiert sind, konzentrieren wir uns in unserer Arbeit auf die Evaluierung von UQ-Methoden für SER unter den üblichen Herausforderungen in der realen Welt, wie z. B. beschädigte Signale und das Fehlen von Sprache. Wir zeigen, dass einfache UQ-Methoden bereits einen Hinweis auf die Unsicherheit einer Vorhersage geben können und dass das Training mit zusätzlichen OOD-Daten die Identifizierung solcher Signale erheblich verbessern kann.