Das Bild zeigt einen Laptop mit Schallplatten-Symbol und Kopfhörern, der rote Unterbrecher steht für New Version.

devAIce® SDK 3.14 und devAIce® Web API 4.7: Großes Upgrade auf Expression (Large)  

,
Milenko Saponja

Die neuesten Versionen von devAIce® SDK 3.14 und Web API 4.7 haben das Modul Expression (Large) erheblich verbessert und machen es genauer und effizienter als je zuvor.
 

Upgrades für verbesserte Genauigkeit und Leistung 

Die dimensionalen und kategorialen Modelle des Moduls Expression (Large) wurden mit fortschrittlichen Versionen aktualisiert, die die Erkennungsgenauigkeit verbessern und gleichzeitig den Ressourcenverbrauch reduzieren. Das neue Modell wurde auf mehr Daten, einschließlich neuer Sprachen, trainiert, wodurch seine Robustheit weiter verbessert wurde.
Vor allem die Genauigkeit der kategorialen Ausgabe wurde erheblich verbessert, was eine zuverlässigere Ausdrucksanalyse gewährleistet. Der ungewichtete durchschnittliche Wiedererkennungswert (UAR) wurde von 0,65 auf 0,70 verbessert, wenn er mit mehreren Testreihen ausgewertet wurde, die sowohl aus gespielten als auch aus nicht gespielten Ausdrücken bestanden und eine Vielzahl verschiedener Sprecher, Sprachen, Mikrofone und akustischer Umgebungen enthielten.
Außerdem arbeitet das Modul jetzt effizienter, wenn sowohl kategoriale als auch dimensionale Ausgaben aktiviert sind, was die Gesamtleistung optimiert. 

Zusätzliche Verbesserungen für devAIce® SDK

Dieses Update enthält auch Korrekturen und Verbesserungen im gesamten SDK, einschließlich Korrekturen der ASR-Spracherkennung und verbesserter RT₆₀-Ausgabe im Modul Audioqualität.
Die Dokumentation wurde ebenfalls verbessert und um zusätzliche Informationen über die parallele Nutzung des SDKs und die Containerisierung erweitert, die eine gängige Art und Weise zu sein scheint, wie das devAIce® SDK genutzt wird.
 

Ihre Eindrücke von den neuesten devAIce®-Upgrades 

Hier finden Sie eine Zusammenfassung der wichtigsten Verbesserungen, die Sie mit devAIce® SDK 3.14 und Web API 4.7 erhalten und die Sie kennen sollten: 

  • Verbesserte Expressionsgenauigkeit (groß): Die kategoriale Ausgabe UAR wurde von 0,65 auf 0,70 erhöht, was eine präzisere Expressionsanalyse in verschiedenen Umgebungen ermöglicht. 
  • Optimierte Leistung: Effizientere Verarbeitung bei der Verwendung von kategorischen und dimensionalen Ausgaben, Reduzierung des Ressourcenverbrauchs von 900 MB auf 550 MB
  • Erweiterte Sprachunterstützung: Training mit zusätzlichen Daten und Sprachen für mehr Robustheit. 
  • Verbesserte ASR und Audioqualität: Korrekturen bei der ASR-Spracherkennung und verbesserte RT₆₀-Ausgabe im Audioqualitätsmodul. 
  • Bessere Dokumentation: Erweiterte Informationen zur parallelen SDK-Nutzung und zur Containerisierung, um reale Einsatzanforderungen zu unterstützen.

    Aktualisieren Sie jetzt, um von diesen leistungsstarken Verbesserungen zu profitieren! Kontaktieren Sie uns, wenn Sie Ihre Sprachreise beginnen möchten: sales@audeering.com