2023

Fröhliches oder böses Lachen? Analyse einer Datenbank mit natürlichen Hörproben

Aljoscha Düsterhöft, Felix Burkhardt, und Björn W. Schuller

Wir führten eine Datenerhebung auf der Grundlage der Google AudioSet-Datenbank durch, indem wir eine Teilmenge der mit Lachen annotierten Samples auswählten. Das Auswahlkriterium war, dass es sich um einen kommunikativen Akt mit einer klaren Konnotation handelt, die entweder positiv (mitlachen) oder negativ (ausgelacht werden) ist. Auf der Grundlage dieser annotierten Daten führten wir zwei Experimente durch: Zum einen extrahierten und analysierten wir manuell phonetische Merkmale. Andererseits führen wir mehrere Experimente zum maschinellen Lernen durch, indem wir systematisch mehrere automatisch extrahierte akustische Merkmale mit Algorithmen zum maschinellen Lernen kombinieren. Dabei zeigt sich, dass die leistungsfähigsten Modelle eine ungewichtete durchschnittliche Trefferquote von 0,7 erreichen können.

Eine wissenschaftliche Veröffentlichung der audEERING GmbH.
Mehr Infos auf unserer Forschungsseite