audEERING®, ein führender Anbieter von Sprachanalyse-Technologien, hat sich auf eine strategische Reise begeben und bietet sowohl Open-Source-Modelle als auch kommerzielle Lösungen an. In dieser Blogserie werden zunächst die innovativen Open-Source-Modelle für die Erkennung von Alter und biologischem Geschlecht sowie die Ausdrucksanalyse vorgestellt, die einem breiten Publikum zugänglich sind und als Sprungbrett für die anspruchsvolleren Funktionen von audEERINGs kommerziellem Produkt, devAIce®, dienen.
Open-Source-Modelle für Forschung und akademische Nutzung
audEERING® hat ein Open-Source-Modell auf Hugging Face zur Vorhersage von Alter und biologischem Geschlecht anhand der Stimme veröffentlicht, das ausschließlich für den akademischen Gebrauch und die Forschung bestimmt ist. Ein bahnbrechendes Tool, das auf Daten aus drei öffentlichen Datenbanken basiert. Dieses Modell, das auf der 15. ITG-Konferenz über Sprachkommunikation an der RWTH Aachen vorgestellt wurde, ist ein bedeutender Schritt zur Demokratisierung von sprachgesteuerten Technologien.
Der Zusammenhang zwischen Alter und biologischem Geschlecht
Das Modell unterscheidet zwischen zwei Geschlechtsklassen und einer altersbedingten dritten Klasse: weiblich, männlich und Kinder - letztere werden in der Stimme nicht nach dem biologischen Geschlecht unterschieden wie Erwachsene.

Das biologische Geschlechtsmodell liefert 2 binäre Klassen (männlich und weiblich) + das Alter in Jahren im Altersmodell. Die Verbindung zwischen diesen Modellen besteht darin, dass die Kinderstimme unterschiedliche akustische Strukturen aufweist, was eine geschlechtsspezifische Unterscheidung unmöglich macht. Wenn also eine Stimme als Kinderstimme identifiziert wird, erhält sie das Modell-Label "Kind" und keine Geschlechtszuordnung. Das Alter von Erwachsenen und Kindern kann mit einer Abweichung von nur wenigen Jahren genau bestimmt werden. Dieser Ansatz erweitert die Anwendbarkeit des Modells und entspricht dem wachsenden Bedarf an integrativer Technologie.
Mit über 12.000 Downloads allein im März 2024 und einem Gesamtdownload von fast 100.000 (für zwei Modellversionen) in weniger als einem Jahr ist die Wirkung des biologischen Alters-Geschlechts-Modells offensichtlich und spiegelt das Engagement von audEERING für Transparenz und Zusammenarbeit im digitalen Zeitalter wider. Das Open-Source-Modell unterstützt Forscher und fördert die weltweite Nutzung.
Die devAIce® commercial suite - einfach zu implementieren
Für kommerzielle Nutzer bietet audEERING® ein kommerzielles Altersmodell mit höchster Genauigkeit und validierter Robustheit, das vollständig in die devAIce® SDK- und Web API-Produkte integriert ist. Die kommerzielle devAIce®-Suite ist auf Unternehmen zugeschnitten, die genaue Alters- und biologische Geschlechtsanalysen benötigen.

Der Vergleich in der Abbildung zeigt die Open-Source- und 2 Generationen von kommerziellen Modellen. Wir zeigen, dass Open Source dem Qualitätsstandard folgt, den wir mit unseren kommerziellen Modellen gesetzt haben, und sich ständig verbessert.
Erläuterung: CCC - Koeffizient, der die Korrelation zwischen dem tatsächlichen und dem vorhergesagten Alter angibt; je höher, desto besser. Der mittlere Durchschnittsfehler in Jahren geteilt durch 10, je niedriger, desto besser. Das Ergebnis des öffentlichen Modells liegt im Durchschnitt 10,9 Jahre vom tatsächlichen Alter ab.
Prepaid-Pakete mit allen AI-Modulen - mit einem begrenzten Angebot

Über die devAIce® Web API können Sie zwischen zwei Prepaid-Optionen mit einem limitierten Angebot wählen, das alle devAIce®-Pakete umfasst.

Das Sprechermodul ist mit einer Alterserkennung und einer so genannten gefühlten Geschlechtserkennung ausgestattet.
Für weitere Informationen besuchen Sie unsere neu gestaltete Website und setzen Sie sich mit uns in Verbindung.