devAIce® SDK 3.14 und Web API 4.7: Expression-Upgrade (groß)

Tags: KI, künstliche Intelligenz, devAIce, Technologie

Februar 12, 2025,

Milenko Saponja

Die neuesten Versionen von devAIce® SDK 3.14 und Web API 4.7 verbessern das Expression-Modul (groß) deutlich und machen es genauer und effizienter als je zuvor.

devAIce® SDK 3.14 und Web API 4.7: Expression-Upgrade (groß)

Upgrades für verbesserte Genauigkeit und Leistung

Die dimensionalen und kategorialen Modelle des Moduls „Expression (Large)“ wurden durch erweiterte Versionen ergänzt , die die Erkennungspräzision verbessern und gleichzeitig den Ressourcenverbrauch reduzieren. Das neue Modell wurde mit mehr Daten , einschließlich neuer Sprachen , trainiert, was seine Robustheit weiter verbessert.
Insbesondere wurde die Genauigkeit der kategorialen Ausgabe deutlich verbessert , was eine zuverlässigere Ausdrucksanalyse gewährleistet. Der ungewichtete durchschnittliche Rückruf (UAR) wurde von 0,65 auf 0,70 verbessert, wenn er anhand mehrerer Testsätze mit gespielten und nicht gespielten Ausdrücken und einer Vielzahl unterschiedlicher Sprecher, Sprachen, Mikrofone und akustischer Umgebungen ausgewertet wird.
Wenn sowohl kategorische als auch dimensionale Ausgaben aktiviert sind, arbeitet das Modul jetzt effizienter und optimiert die Gesamtleistung.

Zusätzliche Verbesserungen für devAIce® SDK

Dieses Update enthält außerdem Fehlerbehebungen und Verbesserungen im gesamten SDK, darunter Korrekturen bei der ASR-Spracherkennung und eine verbesserte RT₆₀- Ausgabe im Modul „Audioqualität“.
Die Dokumentation wurde außerdem verbessert und um zusätzliche Informationen zur parallelen Verwendung und Containerisierung des SDK erweitert, was eine gängige Art der Verwendung des devAIce® SDK zu sein scheint.

Ihre Eindrücke von den neuesten devAIce®-Upgrades

Hier finden Sie eine Zusammenfassung der wichtigsten Verbesserungen, die Sie mit devAIce® SDK 3.14 und Web API 4.7 erhalten und die Sie kennen sollten:

Verbesserte Expressionsgenauigkeit (groß): Die kategoriale Ausgabe UAR wurde von 0,65 auf 0,70 erhöht, was eine präzisere Expressionsanalyse in verschiedenen Umgebungen ermöglicht.

Optimierte Leistung: Effizientere Verarbeitung bei der Verwendung von kategorischen und dimensionalen Ausgaben, Reduzierung des Ressourcenverbrauchs von 900 MB auf 550 MB.

Erweiterte Sprachunterstützung: Training mit zusätzlichen Daten und Sprachen für mehr Robustheit.

Verbesserte ASR und Audioqualität: Korrekturen bei der ASR-Spracherkennung und verbesserte RT₆₀-Ausgabe im Audioqualitätsmodul.

Bessere Dokumentation : Erweiterte Informationen zur parallelen SDK-Nutzung und Containerisierung zur Unterstützung realer Bereitstellungsanforderungen.

Aktualisieren Sie jetzt, um von diesen leistungsstarken Verbesserungen zu profitieren! Kontaktieren Sie uns , wenn Sie Ihre Sprachreise beginnen möchten: sales@audeering.com