Sympathie ist keine Sprechereigenschaft, sondern eine individuelle Bewertung eines Rezipienten und damit ein wichtiges Thema für eine gewinnbringende Sprachkommunikation.
Der soziale Aspekt der unbekannten Stimmen
Wenn wir eine Person zum ersten Mal hören, können wir nicht umhin, Vermutungen anzustellen, Erwartungen zu entwickeln und ja, uns bereits eine erste Einstellung zu der menschlichen oder künstlichen Persönlichkeit zu bilden, die durch diese Stimme transportiert wird. Natürlich sind die Grundlagen, auf denen wir unsere Eindrücke aufbauen, sehr spärlich, und wir hoffen, dass wir unsere Eindrücke mit mehr validen Daten als nur diesen wenigen akustischen (und visuellen) Oberflächenmerkmalen abgleichen. Dennoch kann sich dieser erste Eindruck auf unser eigenes Verhalten auswirken, z. B. darauf, ob wir offener oder zurückhaltender auf den Sprecher reagieren oder wie wir die Aussagen des anderen interpretieren. Wir können sogar weitere Interaktionen ganz vermeiden, wenn wir diese Person als unsympathisch empfinden.
Dies gilt nicht nur für menschliche Stimmen in Gesprächen von Angesicht zu Angesicht, sondern auch in der Telekommunikation, insbesondere aufgrund der höheren Bandbreiten und der insgesamt verfügbaren Qualität und Natürlichkeit. Heutzutage haben auch die Stimmen von persönlichen Assistenten, interaktiven Sprachausgaben für Selbstbedienungsdienste und Smart-Home-Geräten ein Maß an Natürlichkeit erreicht, das es manchmal schwierig macht, ihre Künstlichkeit zu erkennen. Infolgedessen wird die soziale Akzeptanz bei ersten Begegnungen nicht nur in der menschlichen Kommunikation, sondern auch in der Mensch-Computer-Interaktion immer wichtiger. Daher ist es an der Zeit, sich auf ihre sozialen Auswirkungen zu konzentrieren.
Aspekte des ersten Eindrucks
Neben der reinen sprachlichen Bedeutung transportieren Stimme und Sprechstil noch viel mehr Informationen. Wir können - richtig oder falsch - auf das Alter, den sozialen und regionalen Hintergrund und das Geschlecht schließen. Wir können sogar Attraktivität, Stimmung, Einstellung und Aspekte der Persönlichkeit einschätzen. All diese Faktoren können beeinflussen, ob ein Zuhörer oder Gesprächspartner einen Sprecher mag oder nicht. Insbesondere der Hintergrund ist anfällig für positive oder negative Stereotypen. Und ohne persönliche Erfahrung kann ein bestimmter Sprechstil, z. B. der eines Callcenter-Agenten, leicht (fälschlicherweise) einer bestimmten Einstellung oder Haltung zugeschrieben werden, anstatt ihn als individuelle Eigenschaft zu erkennen.
Bekannte Mechanismen sind die Bevorzugung von Menschen mit ähnlichem Hintergrund und ähnlicher Subkultur, die generelle Bevorzugung attraktiver Stimmen oder die Bevorzugung von Sprechstilen, die
Interesse und Freundlichkeit signalisieren, z. B. durch eine leicht erhöhte Tonhöhe, lebhafte Tonhöhenbewegungen, ein leicht erhöhtes Tempo und ein hörbares Lächeln. Auch eine klare Stimme mit ihren spektralen Implikationen
von geringerer Hochfrequenzdämpfung und stärkeren Obertönen wird typischerweise bevorzugt, ebenso wie eine klare Aussprache. Solche Mechanismen sind den visuellen Hinweisen (Körperbewegungen, Kleidung,
Gesicht) recht ähnlich.
Die Einschätzung der Beliebtheit einer Stimme ist ein heikles Thema
Bei der Arbeit berücksichtigen wir natürlich all diese Aspekte, wenn wir zum Beispiel professionelle Sprecher als Sprecher auswählen. Die automatische Einschätzung der Beliebtheit einer Stimme ist jedoch ein heikles Thema. Zunächst einmal können nur Mehrheitsentscheidungen für bestimmte Bereiche vorhergesagt werden. Nehmen wir zum Beispiel eine Person mit einem starken regionalen Akzent. Im Gegensatz zur Einschätzung des Geschlechts oder des Alters hängt die Sympathie wirklich vom Auge des Betrachters ab (und ich schreibe diesen Blog gerade im Herzen Bayerns). Auch ist die konkrete Situation ausschlaggebend dafür, ob ein bestimmter, deutlich ausgeprägter oder betonungsfreundlicher Stil angemessen ist oder nicht. Gerade bei synthetischen Stimmen kann ein nicht zum Inhalt und zur Situation passender Stil den ersten Eindruck dominieren und so z.B. ein klares und ansprechendes Timbre trüben.
Außerdem verallgemeinern sich systematische Effekte, die in der Forschung gefunden wurden, ebenso wie automatische Modelle, aus den Daten. Daher sollte eine klare Stimme gegenüber Sprechern, die z. B. eine raue Stimme haben, bevorzugt werden. Vielleicht sind Sie aber auch schon Menschen begegnet, die ein leichtes Problem mit ihren Stimmlippen haben. Abhängig von der genauen Ausprägung kann dies sogar dazu führen, dass man als interessanter, attraktiver und sympathischer wahrgenommen wird.
Sympathie ist keine Eigenschaft eines Sprechers - es ist die Wahrnehmung durch eine Person
Daher sollte die Sympathie nicht als Merkmal eines Sprechers wie Alter oder Geschlecht betrachtet werden, sondern als kontextspezifisch und als Bewertung der (abgeleiteten) Sprecherzustände und -eigenschaften durch eine einzelne Person. Natürlich gibt es eine Übereinstimmung zwischen Zuhörern, die aufgenommene Sprachproben bewerten. Dies kann modelliert werden und liefert eine gute erste Schätzung für einen bestimmten Kontext. Aber diese Übereinstimmung ist nicht so stark wie z. B. bei grundlegenden Emotionen. Die ausschließliche Berücksichtigung der Akustik (d. h. der Qualität des Signals, der Natürlichkeit der Sprache, der spektralen Klangfarbe oder der Intonation) schränkt die Genauigkeit der Bestimmung der Sympathie einer Stimme sicherlich ein. Und nur durch das Verständnis der Besonderheiten des Inhalts und der sozialen Situation werden virtuelle Personen in der Lage sein, durch Design sympathisch zu werden. Dies gilt insbesondere für soziale Roboter und synthetische Personen in virtuellen Umgebungen, die auch einen visuellen oder sogar manifestierten Körper haben, an den sie ihre Stimme und ihren Sprechstil anpassen können. Wenn also eine Stimme sehr gut zu dem "Wesen" passt, kann sie auch leicht verzerrt oder ungewöhnlich klingen. Trotz dieser Herausforderungen liegt in der individuellen Abhängigkeit zwischen zwei Personen im Gespräch auch Potenzial, da eine gegenseitige Umstellung in Sprachstil und Aussprache als positiv für die Sympathie angesehen wird. Wir verfolgen Ansätze, diesen Effekt für den adaptiven Dialog zu nutzen.
Es gibt viele Möglichkeiten, mit seiner Stimme als sympathisch zu gelten.
Folglich gibt es viele Möglichkeiten, mit der eigenen Stimme als sympathisch zu gelten. Da so viele Faktoren eine Rolle spielen, gibt es keinen allgemeinen Ratschlag, um Sympathie zu gewährleisten. Zum Beispiel müssen Männer nicht unbedingt eine tiefe Stimme haben, um positiv wahrgenommen zu werden. Für Designer ist dies natürlich eine häufige Herausforderung, und es gibt Designmethoden und Nutzerforschung, um eine Lösung für ein bestimmtes Produkt oder eine Dienstleistung zu finden. Für automatische Klassifikatoren könnte es fruchtbarer sein, statt zu versuchen, das komplexe Konzept der Sympathie zu erfassen, mehr auf verwandte soziale Signale von Sprechern wie Freundlichkeit und Engagement zu achten, um genaue Vorhersagen zu erhalten - zumindest für unbekannte Stimmen. Vor allem, wenn sich Beziehungen entwickeln, werden diese stimmlichen Oberflächenmerkmale immer irrelevanter, da sie nur dazu dienen, eine Person zu identifizieren - wir (glauben), ihre Persönlichkeit bereits zu kennen, und entscheiden nicht anhand der Sprechweise und der Stimme, sondern anhand von Handlungen, ob wir diese Person mögen.