Whisper-Transkription unter DSGVO — Plenarrede-Pipeline und Personen-Daten Dritter
Whisper-Transkription ist 2026 das Kern-Tool der Plenarrede-Pipeline. Aber: ein Plenarrede-Transkript enthält fast immer Personen-Daten Dritter — Zwischenrufer, Co-Redner, manchmal benannte Bürger. Die DSGVO-Konformität dieser Transkription ist nicht trivial. Welche Provider-Wahl, welcher Datenfluss, welcher Lawful-Basis-Pfad sind 2026 möglich?
Whisper-Transkription ist 2026 das Kern-Tool der Plenarrede-Pipeline. Ein Plenarrede-Audio von 30 Sekunden enthält typisch Sprache des Mandatsträgers, oft Zwischenrufe anderer Abgeordneter, gelegentlich benannte Bürger oder Dritte aus Reden. Das Transkript ist damit eine Sammlung personenbezogener Aussagen — und unterliegt der DSGVO. Welche Provider-Wahl, welcher Datenfluss, welcher Lawful-Basis-Pfad sind 2026 DSGVO-konform?
Was hier untersucht wird
Dieser Tiefe-2-Artikel zerlegt die DSGVO-Frage für Whisper-Transkription in der Plenarrede-Pipeline. Die Vor-Vertiefungen T2-C20-01 und T2-C20-02 haben die generelle DSGVO-KI-Lage beschrieben. Hier wird die spezifische Whisper-Anwendung detailliert.
Die Whisper-Tool-Optionen 2026
Drei Optionen.
Option eins: OpenAI Whisper API (cloud-basiert). Datenfluss in OpenAI-Cloud, typisch USA-Hosting. DPF-konform bei OpenAI-Standard-Account.[1] Vorteil: höchste Transkriptions-Qualität, einfache Integration. Nachteil: Daten verlassen die EU; AVV-Pflicht; bei sensiblen Plenarrede-Themen problematisch.
Option zwei: Selbst-gehostetes Whisper (z.B. faster-whisper auf eigenem Server). Datenfluss bleibt auf eigenem Server. Vorteil: volle Datenhoheit, kein Drittland-Transfer, keine AVV-Frage. Nachteil: Infrastruktur-Aufwand, etwas geringere Transkriptions-Qualität als OpenAI-API.
Option drei: EU-Region-Hosting (Microsoft Azure OpenAI Service in EU-West-Region). Whisper läuft auf Azure-Infrastruktur in der EU. Vorteil: keine Drittland-Transfer-Frage, AVV via Azure-Standard-Vertrag. Nachteil: höhere Kosten als Direct-API; mehr Setup-Aufwand.
Die Lawful-Basis-Frage
Für die Whisper-Transkription von Plenarrede-Material braucht es eine DSGVO-Lawful-Basis (Art. 6 DSGVO). Drei mögliche Basen.
Basis eins: berechtigtes Interesse (Art. 6 Abs. 1 lit. f). Politische Berichterstattung über parlamentarische Tätigkeit ist ein anerkanntes berechtigtes Interesse. Die Verarbeitung der Plenar-Daten ist erforderlich; der Mandatsträger-Interesse überwiegt typisch die Betroffenen-Interesse-Schutz. Diese Basis ist 2026 die Praxis-Standard-Antwort.
Basis zwei: Wahrnehmung einer öffentlichen Aufgabe (Art. 6 Abs. 1 lit. e). Mandatsträger könnte sich auf die parlamentarische Funktion als öffentliche Aufgabe berufen. Juristisch nicht restlos geklärt für Sekundär-Verbreitung von Plenar-Material.
Basis drei: Einwilligung (Art. 6 Abs. 1 lit. a). In der Praxis nicht anwendbar — die Personen, deren Aussagen transkribiert werden (Zwischenrufer etc.), können nicht praktikabel einwilligen.
In der Praxis 2026 läuft die Lawful-Basis-Argumentation typisch über Basis eins (berechtigtes Interesse).
Art. 9 DSGVO und besondere Kategorien
Eine zusätzliche Schicht: wenn Plenarreden Inhalte über besondere Kategorien personenbezogener Daten enthalten (Gesundheit, politische Meinungen Dritter, religiöse Überzeugung, sexuelle Orientierung, etc.), greift Art. 9 DSGVO. Die Verarbeitung ist dann strenger reglementiert.
Bei Mandatsträger-Plenarrede-Pipelines: solche Inhalte kommen vor (z.B. bei Debatten zu Schwangerschaftsabbruch, LGBTIQ-Rechten, Religions-Politik). In diesen Fällen sollte Justiziar-Konsultation erfolgen.
Operative Empfehlungen 2026
Drei priorisierte Empfehlungen.
— Priorität A: Provider-Wahl bewusst. Für Standard-Plenarrede-Transkription: Microsoft Azure OpenAI Service in EU-West-Region. Für sensitivere Inhalte: selbst-gehostetes Whisper.
— Priorität B: Lawful-Basis-Dokumentation. Pro Pipeline-Stufe wird die Lawful-Basis schriftlich fixiert. Aufwand: zwei Stunden mit Datenschutz-Beauftragten.
— Priorität C: Art.-9-Eskalations-Routine. Bei Plenarreden zu Art.-9-Themen: zusätzliche Justiziar-Prüfung vor Pipeline-Verarbeitung.
Empfehlungen mit Priorität
— Priorität A: EU-Region-Hosting oder selbst-gehostetes Whisper. — Priorität B: Lawful-Basis-Dokumentation. — Priorität C: Art.-9-Eskalations-Routine.
Status-Hinweis
Stand 19.05.2026: Pre-Launch-Compliance-Review abgeschlossen. Bei konkretem Anwendungs- oder Streitfall ist die Konsultation eines spezialisierten Fachanwalts weiterhin empfohlen. DSGVO-Konformität bei KI-Tool-Nutzung ist 2026 in laufender Entwicklung. Datenschutz-Beauftragter-Konsultation empfohlen.
Wo das hingehört
Tiefe-1 DSGVO und KI: T1-C20. Art.-22-automatisierte-Entscheidungen: T2-C20-01. KI-Auftragsverarbeitung: T2-C20-02. Pipeline-Stufe-1-Quellenerfassung: T2-C09-01. Folge: T2-C20-04 — Voice-Cloning-Datenschutz.
Codex AI-Automation Sektion 13.
Quellen
OpenAI, Whisper API Documentation and Data Processing, Permalink, Abruf 18.05.2026.
Microsoft Azure, Azure OpenAI Service — EU-West Region Hosting, Permalink, Abruf 18.05.2026.
DSGVO, Art. 6 — Rechtmäßigkeit der Verarbeitung, Permalink, Abruf 18.05.2026.
DSGVO, Art. 9 — Besondere Kategorien personenbezogener Daten, Permalink, Abruf 18.05.2026.