Es ist realitätsfern, personenbezogene Daten bei KI-Tools zu untersagen

Eigentlich ist es offensichtlich, dass personenbezogene Daten –zumindest in geringem Umfang– über  Prompts an KI-Tools übertragen werden.

Seien es E-Mails, die beantwortet, Texte deren Sprache verbessert oder Bilder, die mit Hilfe der KI bearbeitet werden sollen.

Mensch sollte es nicht
einfach verbieten!

Der Beitrag beleuchtet die Nutzung von KI-Tools im dienstlichen Kontext.

Zugelassen für den dienstlichen Einsatz sollten ausschließlich Tools sein, für die eine Lizensierung und ein Auftragsverarbeitungsvertrag vereinbart sind. Hier geht es hier ausschließlich um Web-basierte KI-Tools, für lokal oder im eigenen Rechenzentrum betriebene Tools ist die Situation von vornherein klarer.

Dienstliche Nutzung von KI-Tools

In der Regel wird für die dienstliche Nutzung lizensierter KI-Tools untersagt, personenbezogene und andere vertrauliche Daten an die externen Dienste zu übertragen.

Begründet wird das häufig damit, dass Risiken für die Betroffenen bestehen, sofern ihre Daten Dritten offengelegt werden.

Eine Untersagung ist aus mehreren Gründen bedenklich:

  • Aus datenschutzrechtlicher Sicht sollten sowohl die Zweckbindung als auch geeignete Schutzmaßnahmen im Auftragsverarbeitungsvertrag vereinbart sein. Das minimiert die verbliebenen Risiken für die Betroffenen.
  • Für Beschäftigte ist es kaum praktikabel, alle Personenbezüge aus Inhalten vorab zu entfernen. So kann jeder einzelne Prompt ein „Exzess“ im arbeitsrechtlichen Sinne werden.
  • Grundsätzlich besteht für den Arbeitgeber die Herausforderung, dass Vorgaben durchgesetzt und die Einhaltung der Nutzungsbedingungen kontrolliert werden müssen. Zumindest stichprobenartig müssten Prompts dafür ausgewertet werden, wobei ein „Mitlesen“ aber zumeist nicht erwünscht ist. Ohne Kontrolle wäre es eine „betriebliche Übung“ – ein nicht durchgesetztes Verbot führt zur Duldung.
  • Für jede*n Einzelne*n sind Chatverläufe selbst dann personenbezogen, wenn diese selbst keine personenbezogenen Daten enthalten, da Interessen und Aktivitäten daraus ableitbar sind.

Was zeichnet datenschutzkonforme Lösungen aus?

Vereinbarung eines Auftragsverarbeitungsvertrages ist durchgPflicht, da sonst die Anbieter die Bedingungen einseitig festlegen und anpassen können.

Außerdem sollten über das sonst Übliche hinaus gehende verbindliche technische und organisatorische Maßnahmen getroffen werden, z.B.

  • Festlegung kurzer Löschfristen
  • durchgängige Verschlüsselung, z.B. Ende-zu-Ende-verschlüsselte Übertragung und verschlüsselte Speicherung auf den Servern des Anbieters, idealerweise mit Key-Management durch den Auftraggeber
  • Datensparsames Setup, z.B. ein „Anfrage-Pool“ wie bei HAWKI statt personalisierter Accounts oder Nutzung auschließlich über Browser statt App
  • Datentransfers in Drittstaaten vermeiden, bspw. durch Beauftragung von Unternehmen aus der EU oder Vereinbarung europäischer Serverstandorte, da dann der Zugriff Dritter wie US-Behörden erschwert wäre
  • Ausdrückliche Vereinbarung des Ausschlusses eigener Verarbeitungszwecke des Anbieters
  • Zugriff auf Logfiles durch Beschäftigte des Auftraggebers, z.B. Integration in ein SIEM

Was sollte geregelt werden?

Wünschenswert sind praxisnahe Regelungen, die Do’s und Don’t für die Nutzenden benennen.

  • Ausschließlich Nutzung von Tools mit vereinbarter Auftragsverarbeitung
  • Personenbezogene Daten sollten nur in geringem Umfang mit Web-basierten KI-Tools verarbeitet werden
  • Ethische Grundsätze sollten befolgt werden.
  • Eine idealerweise bereits erfolgte Klassifikation von Informationen/Dokumenten sollte berücksichtigt werden.
  • Die Risiken für die Betroffenen sollten bedacht und als gering bewertet werden

Was sollte besser nicht gepromptet oder hochgeladen werden?

  • Vertrauliche Vertragsdokumente
  • Personenbezogene Daten in größerem Umfang, z.B. Teilnehmendenlisten von Veranstaltungen
  • Gesundheitsdaten u.a. personenbezogene Daten besonderer Kategorien nach Art. 9 DSGVO
  • Klassifizierte Informationen, z.B. bei NDAs (non-disclosure agreements)
  • Intellectual Properties (z.B. Patentanmeldungen, Forschungsdaten)

Schulungen und Anleitungen sollten sich gezielt diesen Punkten widmen, typische Beispiele könnten die aufgestellten Regeln illustrieren.

Gute Beispiele für datenschutzkonforme KI-Tools an der TU Berlin sind ChatAI in der AcademicCloud und ChatGPT EDU an der Fakultät VII:

Zusatz

Auch das generelle Verbot des Hochladens urheberrechtlich geschützter Werke sollte geprüft werden, da bspw. das Erstellen einer Zusammenfassung, die Manipulation eines Bildes oder das Prüfen auf Plagiate durchaus zulässige Verarbeitungen sein können.

 

Autor: don't panic

Über das Pseudonym: "Don't panic" ist auf das Cover des legendären elektronischen Reiseführers durch die Galaxis gedruckt, damit ein Anhalter keine Angst verspürt. - The British author Arthur C. Clarke said Douglas Adams' use of "don't panic" was perhaps the best advice that could be given to humanity. cf. Wikipedia

2 Gedanken zu „Es ist realitätsfern, personenbezogene Daten bei KI-Tools zu untersagen“

  1. Liebes Datenschutzteam,

    wieder, ein super guter Beitrag zum Thema KI! Es sind viele gute nuetzliche Tipps und Anregungen erhalten und betrachtet das Thema von mehreren Seiten.
    Aber, ist das jetzt die offizielle Meinung der TUB oder „nur“ eine/die Meinung des Datenschutzes. Ich wünschte mir dazu auch offizielle Stellungnahmen und Handlungsempfehlungen von der TUB…
    mfg und weiter so!
    Mario Lasch

    1. Lieber Mario Lasch,

      danke für den Zuspruch!

      Dieser wie alle anderen Blog-Beiträge sind meine Meinung und in diesem Fall auch meine Position als Datenschutzbeauftragter der TU Berlin.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert