dataSecurity-icon

Datensicherheit: Die 6 häufigsten Fragen an Simone Hantke

,
Caro Bauer

Datensicherheit ist das A und O, wenn es um den Einsatz von künstlicher Intelligenz in Produkten aller Art geht. Für diesen Blogbeitrag haben wir unsere Expertin Simone Hantke, Director Data Intelligence bei audEERING, zum Thema Datensicherheit befragt. Wir beantworten die sechs am häufigsten gestellten Fragen zum Thema Datensicherheit und wie wir mit sensiblen Daten umgehen

1. Simone, Sie sind der Director Data Intelligence hier bei audEERING. Was verstehst du unter dem Begriff Datensicherheit?

Datensicherheit hat meiner Meinung nach mehrere Aspekte: den internen Umgang mit Daten, z. B. für die Personalabteilung, und den Umgang mit externen Daten, z. B. von einem Kunden. Wir wollen uns hier auf die Aspekte konzentrieren, die für Kunden relevant sind. Wenn wir mit Kundendaten arbeiten, haben wir mehrere Regeln - unter anderem die folgenden zwei:
- Nur interne Datenspeicherung: Die Daten werden auf unseren internen Servern gespeichert und der Zugang ist beschränkt. Keine Datenspeicherung in der Cloud oder auf den Laptops der Mitarbeiter.
- Zugang nur für autorisierte Personen: Zunächst einmal muss der Prozess der Datenübermittlung an uns sicher sein. Von der Übergabe an uns bis zum Ende eines Projekts ist klar, wer Zugang hat und mit den Daten arbeiten darf. Manchmal gibt es Kunden, die nur eingeschränkte Zugriffsrechte erteilen, so dass wir bestimmte Regeln auf unseren Servern festlegen müssen. Dann müssen wir auch verfolgen, wer wann mit bestimmten Daten gearbeitet hat.

2. Wie ist Ihr Standpunkt zum Datenschutz bei audEERING?

Ich bin die Person, die Themen und Ideen sammelt und ihr Wissen an unser Forschungsteam weitergibt. Bei der Datenerfassung mache ich Vorschläge, schreibe zum Beispiel die Datenrichtlinien für die Datenerfassung für spezielle Apps und gebe sie dann an unseren Datenschutzbeauftragten weiter. Bei der Datenspeicherung muss ich die Lizenzen mit allen Informationen zur Nutzung prüfen und mit mehreren Kollegen abstimmen.

3. Wie wird dieser Datenschutz gewährleistet, z. B. in Bezug auf das AI SoundLab-Portal, das sensible Sprach- und Gesundheitsdaten enthält?

Sprachdaten sind immer etwas Besonderes, weil man die Daten nicht vollständig anonymisieren kann. Der Klang der Stimme einer Person ist so einzigartig, dass auch ohne Angabe eines Namens oder anderer persönlicher Informationen jemand diese Person möglicherweise erkennen könnte.

Bei unserem Portal AI SoundLab erfassen wir nicht nur die Sprachdaten, sondern auch Metadaten. Je sensibler die Daten werden, desto höher sind die Standards, die hinsichtlich des Datenschutzes eingehalten werden müssen und desto schwieriger ist es, die Daten zu speichern. Das heißt, wir müssen sicherstellen, dass diese Daten sehr streng nach europäischem und deutschem Datenschutzrecht erfasst, übermittelt und gespeichert werden.

4. Hat audEERING das Recht, die gesammelten Informationen für andere Produkte zu verwenden?

Das hängt wirklich von der Art der Daten ab, die wir erhalten, und von der Lizenz, die angewandt wird. Wenn wir Daten von unseren Kunden erhalten, ist die Nutzung in manchen Fällen sehr eingeschränkt. Bei Gesundheitsdaten kann es z.B. sein, dass es bei audEERING nur ein oder zwei Mitarbeiter gibt, die diese Daten überhaupt verarbeiten dürfen. Die Nutzung ist dann auch auf dieses spezielle Projekt mit dem Kunden beschränkt. Außerdem müssen wir die Daten hinterher löschen, so dass wir sie auf keinen Fall für etwas anderes verwenden können.

In anderen Fällen sind die Kunden bereit, uns Daten zur Verfügung zu stellen und uns zu gestatten, die Funktionen der Audiodateien für den Modellbau zu nutzen. Wenn wir zum Beispiel Daten von einer Universität erhalten, gibt es einige offene Lizenzen, die es uns erlauben, diese Daten für verschiedene Produkte, Forschung und Modellbildung zu verwenden.

5. Was können Nutzer unter dem Begriff pseudonym gespeicherte Nutzerdaten verstehen und was ist der Unterschied zwischen anonym und pseudonym gespeicherten Daten

Audiodaten sind einzigartig. Wenn Sie die Person, die spricht, kennen, würden Sie sie wiedererkennen. Das bedeutet, dass Audiodaten nicht vollständig anonymisiert werden können, wenn es sich um echte Audio-Rohdaten handelt, die nicht z. B. mit einem speziellen Filter bearbeitet wurden.

Bei audEERING pseudonymisieren wir die Audiodaten, d.h. wir sammeln Metadaten, die mit den rohen Audiodateien verbunden sind. Hier ein Beispiel, wie das funktioniert: Wenn wir nur nach Geschlecht oder Alter fragen, kann es mehrere Personen im Datenpool geben, die das gleiche Geschlecht und Alter haben und niemand würde wirklich wissen, wer diese Person ist. Wenn wir aber auch nach der Nationalität fragen, werden die Daten weniger pseudonym und irgendwann sind sie gar nicht mehr pseudonym, weil man aus all diesen Daten herauslesen kann, wer diese Person ist. Deshalb versuchen wir, so wenig Daten wie möglich, aber so viele wie nötig zu erheben, um sicherzustellen, dass sie so pseudonym wie möglich sind.

6. Was sind die Besonderheiten der Datensicherheit im Gesundheitswesen (im Allgemeinen)?

Für Gesundheitsdaten sind die Gesetze viel strenger als für andere Daten. Wenn ein Unternehmen auf der Grundlage dieser Daten ein Gesundheitsprodukt herstellen möchte, sind bestimmte Zertifikate erforderlich. Wenn also ein Unternehmen in den Gesundheitssektor einsteigen will, gibt es viel mehr Hindernisse. Für zukünftige medizinische Anwendungen arbeiten wir mit Partnern zusammen, da wir selbst kein medizinisches Unternehmen sind. Derzeit arbeiten wir z. B. mit mehreren Krankenhäusern an Projekten.