EN Login

DSGVO und KI — was geht, was nicht

KI-Verarbeitung personenbezogener Daten ist eng reguliert. Wer fünf AVV-Punkte nicht im Vertrag hat, hat keine Compliance — und politische Daten fallen unter Artikel 9.

Politische Meinungen sind besondere personenbezogene Daten nach Artikel 9 DSGVO. Wer Wählerdaten, Mitgliederlisten oder Kommentar-Texte in ein LLM kippt, ohne Auftragsverarbeitungsvertrag und ohne EU-Region-Hosting, hat zwei DSGVO-Verstöße in einem Klick — und einen drohenden AI-Act-Verstoß als Bonus.

Was hier passiert

Die DSGVO regelt seit 2018, wie personenbezogene Daten verarbeitet werden dürfen. Der EU AI Act regelt seit 2024, welche KI-Systeme zugelassen sind und wie sie betrieben werden müssen. Beide gelten parallel. Wer eine KI-Pipeline für politische Kommunikation baut, fällt in der Regel unter beide.

Die kritische Stelle: Politische Meinungen, Wahlverhalten und Parteizugehörigkeit sind nach Artikel 9 Abs. 1 DSGVO besondere Kategorien personenbezogener Daten. Ihre Verarbeitung ist grundsätzlich verboten und nur unter engen Ausnahmen erlaubt — etwa mit ausdrücklicher Einwilligung der betroffenen Person oder im Rahmen einer rechtmäßigen Tätigkeit politischer Vereinigungen für deren Mitglieder.[1]

Wer ein LLM mit Daten aus einer Wählerbefragung füttert, ohne diese Schritte zu vollziehen, hat ein Compliance-Problem. Wer dasselbe ohne EU-Region-Hosting macht, hat zwei. Wer es ohne Auftragsverarbeitungsvertrag tut, hat drei. Die Bußgelder reichen bis 20 Millionen Euro oder 4 Prozent des Weltumsatzes — je nachdem, was höher ist.[2]

Die Mechanik

Fünf Pflichtpunkte für jeden Auftragsverarbeitungsvertrag mit einem KI-Anbieter.[3]

Erster Punkt: Ausschluss der Modell-Trainings-Nutzung. Der Anbieter darf deine Eingaben nicht zum weiteren Training seines Modells verwenden. Bei Claude über die Anthropic-Enterprise-API gilt das standardmäßig. Bei GPT über die OpenAI-Enterprise-API ebenfalls. Bei der Consumer-Version von ChatGPT gilt es nicht. Wer mit Consumer-Tools politisch sensible Daten verarbeitet, trainiert die KI von OpenAI mit den Daten seiner Mandanten. Das ist DSGVO-rechtlich nicht haltbar.

Zweiter Punkt: Klar spezifizierte Verarbeitungsregion. EU-Region-Garantie. Anthropic Claude über AWS Frankfurt. OpenAI GPT über Azure EU mit Enterprise-Plan. Google Gemini über Vertex AI Belgien. Mistral auf eigener EU-Infrastruktur. Wer die US-Standard-Endpunkte nutzt, transferiert personenbezogene Daten in einen Drittland-Empfänger ohne Angemessenheitsbeschluss — DSGVO-rechtlich problematisch, in Folge des Schrems-II-Urteils nur mit Zusatzgarantien wie Standardvertragsklauseln plus Transfer Impact Assessment zulässig.

Dritter Punkt: Sub-Auftragsverarbeiter-Liste mit EU-Standardvertragsklauseln. Jeder KI-Anbieter nutzt Sub-Auftragsverarbeiter (Cloud-Hosting, Logging, Monitoring). Die Liste muss bekannt sein, jeder Sub-AVV muss DSGVO-konform sein. Wer keine Liste hat, weiß nicht, wo seine Daten liegen.

Vierter Punkt: Lösch- und Aufbewahrungsfristen für deine Anfragen. Nach welcher Zeit werden Logs gelöscht? Anthropic Claude hat eine Standard-Aufbewahrung von 30 Tagen für API-Logs, bei Enterprise-Verträgen verkürzbar. OpenAI ähnlich. Wer keine Frist im Vertrag hat, hat keinen Anspruch auf Löschung.

Fünfter Punkt: Audit- und Auskunftsrechte. Der Auftraggeber muss den Anbieter überprüfen können. Bei Enterprise-Tarifen Standard. Bei Consumer-Tarifen nicht vorhanden.

Diese fünf Punkte sind nicht optional. Artikel 28 DSGVO schreibt sie vor.[3] Ein KI-Tool ohne AVV mit diesen fünf Punkten ist für politische Beratung nicht einsetzbar.

Die Modell-Auswahl-Logik folgt daraus. Drei sinnvolle Spuren.

Spur eins: Enterprise-Tarif mit EU-Hosting. Claude Enterprise via AWS Frankfurt, GPT-4 via Azure EU, Gemini via Vertex AI Belgien. Vollständige AVV verfügbar. Kosten zwischen 50 und 500 Euro pro Monat pro Benutzer, je nach Anbieter und Volumen. Geeignet für Standard-Pressemitteilungen, Faktenrecherche, Content-Entwürfe ohne hochsensible Daten.

Spur zwei: Self-Hosted Open-Source-Modell. Llama 3, Mistral, Mixtral auf eigener Infrastruktur. Keine Drittanbieter, kein Datenabfluss, volle Kontrolle. Hosting-Kosten 200 bis 1.500 Euro pro Monat für eine GPU-Instanz. Geeignet für hochsensible Daten (Mitgliederlisten, Wahlkreis-Analysen, interne Briefings). Technisch anspruchsvoller, aber DSGVO-konform out of the box.

Spur drei: Hybrid mit Anonymisierung. Sensible Daten werden vor dem LLM-Aufruf anonymisiert, der LLM-Output wird re-identifiziert. Funktioniert gut für Aufgaben, in denen der Name der Person nicht prompt-relevant ist (Kommentar-Sentiment-Analyse, Themen-Clustering). Setup-Kosten höher, laufende Kosten niedriger.

Drei Beispiele

Erstes Beispiel: Wahlkreis-Analyse mit Wählerbefragungs-Daten. Eine Partei lässt Wählerbefragungs-Daten — mit Namen, Postleitzahlen, politischen Präferenzen — von einem LLM zusammenfassen. Wenn das LLM eine Consumer-Version von ChatGPT ist, sind die Daten in den USA, ohne AVV, mit Training-Nutzung. Drei DSGVO-Verstöße. Sanktion: bis 20 Millionen Euro oder 4 Prozent Weltumsatz.[2]

Zweites Beispiel: Compliance-Check auf Plenarrede-Transkript. Ein Fraktions-Mitarbeiter prüft den Plenarrede-Entwurf eines MdB gegen einen Compliance-Katalog mit Hilfe eines LLM. Wenn das LLM Claude Enterprise via AWS Frankfurt mit AVV ist und die Rede keine personenbezogenen Daten außer der des MdB selbst enthält, ist das DSGVO-konform. Der MdB hat im Mandatsverhältnis seine Einwilligung implizit über Mitarbeiter-Berechtigung gegeben. Saubere Spur eins.

Drittes Beispiel: Kommentar-Sentiment-Analyse über tausende Bürger-Kommentare. Eine Partei analysiert die Kommentare unter ihren Social-Media-Posts. Die Kommentare enthalten Bürger-Pseudonyme plus inhaltliche Aussagen, die politische Meinungen ableiten lassen. Spur drei: Pseudonyme werden vor der LLM-Verarbeitung anonymisiert, der LLM erhält nur Inhalts-Strings. Output ist Themen-Clustering. Funktioniert DSGVO-konform, weil keine personenbezogenen Daten an das LLM gehen.

Drei verschiedene Anwendungsfälle, drei verschiedene Spuren. Dieselbe Architektur-Logik: prüfe vor jedem Tool-Einsatz, ob personenbezogene Daten beteiligt sind, prüfe die Sensitivitäts-Stufe, wähle die Spur.

Bonus-Anker: D64, das Zentrum für digitalen Fortschritt, hat 2024 eine ausführliche Stellungnahme zu Datenschutz und LLMs publiziert. Die Empfehlung: Open-Source plus Self-Hosting für alle Daten oberhalb der niedrigsten Sensitivitäts-Stufe.[4] Die Empfehlung gilt 2026 weiter — sie ist die einzige Spur, die ohne Vertrauen in einen Drittanbieter auskommt.

Was schief gehen kann

Drei wiederkehrende Failure-Modes.

Erstens, die Consumer-Tool-Falle. Ein Mitarbeiter kopiert eine Liste mit Wähler-Email-Adressen in den ChatGPT-Browser-Tab, weil er die Email-Texte personalisieren möchte. Die Daten sind in den USA, im Training-Korpus, ohne AVV. Bei systematischem Einsatz: meldepflichtige Datenpanne nach Artikel 33 DSGVO innerhalb von 72 Stunden bei der zuständigen Aufsicht.

Zweitens, die Cookie-Tracking-Falle. Eine Kampagnen-Website setzt einen KI-Chatbot ein, der gleichzeitig personenbezogene Daten über die Session speichert. Die DSGVO verlangt eine Rechtsgrundlage für die Verarbeitung (Einwilligung, berechtigtes Interesse, Erfüllung eines Vertrags). Ohne klare Einwilligung im Cookie-Banner und ohne Privacy-Notice ist die Verarbeitung rechtswidrig.

Drittens, die Artikel-9-Falle. Die Verarbeitung von Daten zu politischen Meinungen ist nach Artikel 9 Abs. 1 DSGVO grundsätzlich verboten. Eine Ausnahme nach Artikel 9 Abs. 2 lit. d gilt für rechtmäßige Tätigkeiten politischer Vereinigungen — aber nur für deren Mitglieder. Wer als Beratung Daten zu Nicht-Mitgliedern verarbeitet, ohne explizite Einwilligung, hat keine Rechtsgrundlage. Die Sanktionsstufe ist die höchste der DSGVO.

Eine vierte, oft unterschätzte Falle: die parallel laufende AI-Act-Pflicht. Wer ein LLM einsetzt, das in einem hochrisikoreichen Kontext verwendet wird — politische Werbung mit Targeting kann darunter fallen — muss zusätzlich zur DSGVO-Konformität die AI-Act-Pflichten nach Artikel 6–15 erfüllen. Risk-Management, Daten-Governance, Transparenz, Cybersecurity. Bußgeld kumulativ: DSGVO plus AI Act. Siehe T1-C19 — EU AI Act 2026.

Operativer Hinweis: Die Bundesnetzagentur überwacht die anwendungsseitige Compliance des AI Act. Die Landesdatenschutzbehörden überwachen die DSGVO. Wer in beiden Spuren auffällt, hat zwei parallele Verfahren.

Wo das hingehört

Die AI-Act-Architektur, die parallel zur DSGVO läuft: T1-C19 — EU AI Act 2026. Die Workflow-Orchestrierung, in der DSGVO-Compliance ein eingebauter Layer ist: T1-C18 — n8n-Pipelines. Die Pipeline-Architektur insgesamt: T1-C09 — Sieben-Stufen-Pipeline.

Codex AI-Automation und Implementierung hat die voll ausgearbeitete Datenschutz-Architektur für politische KI-Pipelines, inklusive AVV-Templates und Spur-Auswahl-Logik.

Was du als nächstes tust

Heute machst du drei Inventuren parallel. Erste Inventur: welche KI-Tools setzt dein Team aktuell ein? Liste mit Tool-Name, Anbieter, Tarif (Consumer oder Enterprise). Zweite Inventur: welche Datenarten werden in diese Tools eingegeben? Liste mit Sensitivitäts-Stufe (Standard, personenbezogen, Artikel-9). Dritte Inventur: welche AVV liegen vor? Liste mit Datum, EU-Region-Garantie, Training-Ausschluss.

Jede Kreuzung dieser drei Listen, in der ein personenbezogenes Datum in ein Tool ohne AVV oder ohne EU-Region geht, ist ein offenes Risiko. Das ist deine Compliance-Backlog für die nächste Woche.

Quellen

  1. Landesbeauftragter für den Datenschutz Baden-Württemberg, Rechtsgrundlagen im Datenschutz beim Einsatz von Künstlicher Intelligenz, Permalink, Abruf 17.05.2026.

  2. Datenschutz-Grundverordnung (DSGVO), Artikel 83 — Allgemeine Bedingungen für die Verhängung von Geldbußen, Verordnung (EU) 2016/679, Permalink, Abruf 17.05.2026.

  3. EbeneX (rechtlicher Praxis-Guide), KI und Datenschutz 2026 — DSGVO-konform nutzen, Permalink, Abruf 17.05.2026.

  4. D64 — Zentrum für digitalen Fortschritt, Stellungnahme zum Thema Datenschutz und LLM, 2024, Permalink, Abruf 17.05.2026.