Transparente KI Teil 3: Maschinelles Lernen und KI-Prozesse

,
Soroosh Mashal

In den letzten beiden Episoden haben wir die Definition geklärt und eine der gängigen Methoden zur Modellierung von Emotionen kennengelernt. In dieser Folge wollen wir sehen, was maschinelles Lernen und künstliche Intelligenz sind und wie wir sie nutzen können, um einen KI-Agenten zu erstellen.

Computern dieselben Regeln wie Menschen beizubringen, nennt man maschinelles Lernen. Anstatt ihnen die Regeln vorzugeben, erlaubt man ihnen, die Regeln und Muster selbst zu finden. Maschinelles Lernen ist einer der grundlegenden Prozesse bei der Schaffung von künstlicher Intelligenz (KI), was uns zur nächsten Definition führt.

Transparenz in der Technologie

Von KI spricht man, wenn Computersysteme Aufgaben ausführen können, die normalerweise menschliche Intelligenz erfordern, z. B. visuelle Wahrnehmung, Sprach- oder Emotionserkennung. Ein mit dieser Methode erstelltes System wird manchmal als "KI-Agent" bezeichnet, und unsere Aufgabe ist es, diesen Agenten zu "trainieren". Um dies zu tun, sollten Computer Beispiele sehen, um zu lernen. Der gleiche Prozess findet statt, wenn wir unsere Kinder trainieren. Diese Beispiele werden als Daten bezeichnet. Wir sammeln eine Vielzahl von Daten und kommentieren sie manuell. Das heißt, wir haben ein 3-Sekunden-Audiogeschrei und einen Text, der besagt, dass es zu 70 % wütend ist. Und wir haben einen 2-sekündigen Lachanfall und einen Text, der besagt, dass er zu 90 % fröhlich ist. Wir müssen jedoch sicherstellen, dass wir objektiv bleiben können. Deshalb lassen wir eine große Gruppe von Menschen mit unterschiedlichen Wahrnehmungen (z. B. kulturelle und geschlechtsspezifische Unterschiede) diese Audiostücke kommentieren, und nachdem wir das Ergebnis gemittelt und sichergestellt haben, dass diese Menschen sich einig sind, füttern wir den Computer mit ihnen.

Daten als Nahrung für den Algorithmus

Wir unterteilen unsere Daten im Allgemeinen in 3 Gruppen:

  1. Trainingsdaten
  2. Entwicklungsdaten
  3. Testdaten

Zunächst verwenden wir den Trainingsdatensatz, um die Modelle zu trainieren. Das Modell ist ein neuronales Netz, das die Rolle des Gehirns unseres KI-Agenten übernimmt. Es ist die Phase, in der wir unserem Computerbaby etwas beibringen. Wir probieren verschiedene Methoden wie GANs (Generative Adversarial Networks) oder CNN (Convolutional Neural Networks) und eine Vielzahl von Algorithmen aus, bis wir ein zufriedenstellendes Ergebnis finden. Dann verwenden wir den zweiten Datensatz, der in der Regel der größte ist, um ihn weiterzuentwickeln. Das ist die Zeit, in der die KI alles selbst ausprobieren kann. Es ist eine Art Spielplatz des Lebens für unsere KI. Die KI probiert Tausende von verschiedenen Variablen aus, bis sie ein Stadium erreicht hat, in dem sich die Dinge nicht mehr so stark verändern.

Nun, da unsere jugendliche KI erwachsen genug ist, liegt es an uns als Eltern, sie zu testen, bevor sie ins Erwachsenenleben übergehen und ein nützliches Werkzeug für die Menschen sein kann.

Human-Level-Performance

Aus diesem Grund erstellen wir einen "Testsatz". Das ist ein Datensatz, den unsere KI noch nie gesehen hat. Weder im Training noch in der Entwicklungsphase. Wie gut sie bei diesem Test abschneidet, bestimmt, wie genau und intelligent unsere KI geworden ist. Normalerweise definieren wir diesen Schwellenwert durch Leistung auf menschlichem Niveau. Das bedeutet, dass wir von unserer KI erwarten, dass sie der menschlichen Wahrnehmung so nahe wie möglich kommt. Bei einigen Aufgaben wie der automatischen Spracherkennung, bei denen wir die Grundwahrheit ziemlich genau kennen (was die Person sagt), können wir uns bemühen, 100 % zu erreichen, aber bei anderen Aufgaben wie der Erkennung von Emotionen, bei denen sich Menschen nicht einig sind, wird es schwierig.

Bei solchen Aufgaben berücksichtigen wir immer noch die Objektivität und erwarten, dass die KI uns so nahe wie möglich kommt. Wenn ich einen Satz mit einer relativ fröhlichen Stimme sage und Sie ihn aufzeichnen und 4 zufällige Menschen auf diesem Planeten ihn anhören lassen, könnten 3 ihn fröhlich und 1 ihn neutral finden. In der Zwischenzeit glaube ich, dass ich fröhlich war, aber nur 75 % der Menschen nehmen mich als fröhlich wahr, und da Emotionen etwas sind, das wir ausdrücken, müssen wir immer die Wahrnehmung berücksichtigen. Mit anderen Worten: Die Gefühlswahrnehmung auf menschlicher Ebene lag in diesem Fall bei 75 %, und wir erwarten von unserer KI, dass sie sich diesem Wert so weit wie möglich annähert.

So können Computer darauf trainiert werden, menschliche Gefühle zu verstehen. In der nächsten Folge gehen wir auf einige der Anwendungen dieser Technologie in der heutigen Welt ein.