EN Login

Whisper-Transkription unter DSGVO — Plenarrede-Pipeline und Personen-Daten Dritter

Whisper-Transkription ist 2026 das Kern-Tool der Plenarrede-Pipeline. Aber: ein Plenarrede-Transkript enthält fast immer Personen-Daten Dritter — Zwischenrufer, Co-Redner, manchmal benannte Bürger. Die DSGVO-Konformität dieser Transkription ist nicht trivial. Welche Provider-Wahl, welcher Datenfluss, welcher Lawful-Basis-Pfad sind 2026 möglich?

Whisper-Transkription ist 2026 das Kern-Tool der Plenarrede-Pipeline. Ein Plenarrede-Audio von 30 Sekunden enthält typisch Sprache des Mandatsträgers, oft Zwischenrufe anderer Abgeordneter, gelegentlich benannte Bürger oder Dritte aus Reden. Das Transkript ist damit eine Sammlung personenbezogener Aussagen — und unterliegt der DSGVO. Welche Provider-Wahl, welcher Datenfluss, welcher Lawful-Basis-Pfad sind 2026 DSGVO-konform?

Was hier untersucht wird

Dieser Tiefe-2-Artikel zerlegt die DSGVO-Frage für Whisper-Transkription in der Plenarrede-Pipeline. Die Vor-Vertiefungen T2-C20-01 und T2-C20-02 haben die generelle DSGVO-KI-Lage beschrieben. Hier wird die spezifische Whisper-Anwendung detailliert.

Die Whisper-Tool-Optionen 2026

Drei Optionen.

Option eins: OpenAI Whisper API (cloud-basiert). Datenfluss in OpenAI-Cloud, typisch USA-Hosting. DPF-konform bei OpenAI-Standard-Account.[1] Vorteil: höchste Transkriptions-Qualität, einfache Integration. Nachteil: Daten verlassen die EU; AVV-Pflicht; bei sensiblen Plenarrede-Themen problematisch.

Option zwei: Selbst-gehostetes Whisper (z.B. faster-whisper auf eigenem Server). Datenfluss bleibt auf eigenem Server. Vorteil: volle Datenhoheit, kein Drittland-Transfer, keine AVV-Frage. Nachteil: Infrastruktur-Aufwand, etwas geringere Transkriptions-Qualität als OpenAI-API.

Option drei: EU-Region-Hosting (Microsoft Azure OpenAI Service in EU-West-Region). Whisper läuft auf Azure-Infrastruktur in der EU. Vorteil: keine Drittland-Transfer-Frage, AVV via Azure-Standard-Vertrag. Nachteil: höhere Kosten als Direct-API; mehr Setup-Aufwand.

Die Lawful-Basis-Frage

Für die Whisper-Transkription von Plenarrede-Material braucht es eine DSGVO-Lawful-Basis (Art. 6 DSGVO). Drei mögliche Basen.

Basis eins: berechtigtes Interesse (Art. 6 Abs. 1 lit. f). Politische Berichterstattung über parlamentarische Tätigkeit ist ein anerkanntes berechtigtes Interesse. Die Verarbeitung der Plenar-Daten ist erforderlich; der Mandatsträger-Interesse überwiegt typisch die Betroffenen-Interesse-Schutz. Diese Basis ist 2026 die Praxis-Standard-Antwort.

Basis zwei: Wahrnehmung einer öffentlichen Aufgabe (Art. 6 Abs. 1 lit. e). Mandatsträger könnte sich auf die parlamentarische Funktion als öffentliche Aufgabe berufen. Juristisch nicht restlos geklärt für Sekundär-Verbreitung von Plenar-Material.

Basis drei: Einwilligung (Art. 6 Abs. 1 lit. a). In der Praxis nicht anwendbar — die Personen, deren Aussagen transkribiert werden (Zwischenrufer etc.), können nicht praktikabel einwilligen.

In der Praxis 2026 läuft die Lawful-Basis-Argumentation typisch über Basis eins (berechtigtes Interesse).

Art. 9 DSGVO und besondere Kategorien

Eine zusätzliche Schicht: wenn Plenarreden Inhalte über besondere Kategorien personenbezogener Daten enthalten (Gesundheit, politische Meinungen Dritter, religiöse Überzeugung, sexuelle Orientierung, etc.), greift Art. 9 DSGVO. Die Verarbeitung ist dann strenger reglementiert.

Bei Mandatsträger-Plenarrede-Pipelines: solche Inhalte kommen vor (z.B. bei Debatten zu Schwangerschaftsabbruch, LGBTIQ-Rechten, Religions-Politik). In diesen Fällen sollte Justiziar-Konsultation erfolgen.

Operative Empfehlungen 2026

Drei priorisierte Empfehlungen.

Priorität A: Provider-Wahl bewusst. Für Standard-Plenarrede-Transkription: Microsoft Azure OpenAI Service in EU-West-Region. Für sensitivere Inhalte: selbst-gehostetes Whisper.

Priorität B: Lawful-Basis-Dokumentation. Pro Pipeline-Stufe wird die Lawful-Basis schriftlich fixiert. Aufwand: zwei Stunden mit Datenschutz-Beauftragten.

Priorität C: Art.-9-Eskalations-Routine. Bei Plenarreden zu Art.-9-Themen: zusätzliche Justiziar-Prüfung vor Pipeline-Verarbeitung.

Empfehlungen mit Priorität

Priorität A: EU-Region-Hosting oder selbst-gehostetes Whisper. — Priorität B: Lawful-Basis-Dokumentation. — Priorität C: Art.-9-Eskalations-Routine.

Status-Hinweis

Stand 19.05.2026: Pre-Launch-Compliance-Review abgeschlossen. Bei konkretem Anwendungs- oder Streitfall ist die Konsultation eines spezialisierten Fachanwalts weiterhin empfohlen. DSGVO-Konformität bei KI-Tool-Nutzung ist 2026 in laufender Entwicklung. Datenschutz-Beauftragter-Konsultation empfohlen.

Wo das hingehört

Tiefe-1 DSGVO und KI: T1-C20. Art.-22-automatisierte-Entscheidungen: T2-C20-01. KI-Auftragsverarbeitung: T2-C20-02. Pipeline-Stufe-1-Quellenerfassung: T2-C09-01. Folge: T2-C20-04 — Voice-Cloning-Datenschutz.

Codex AI-Automation Sektion 13.

Quellen

  1. OpenAI, Whisper API Documentation and Data Processing, Permalink, Abruf 18.05.2026.

  2. Microsoft Azure, Azure OpenAI Service — EU-West Region Hosting, Permalink, Abruf 18.05.2026.

  3. DSGVO, Art. 6 — Rechtmäßigkeit der Verarbeitung, Permalink, Abruf 18.05.2026.

  4. DSGVO, Art. 9 — Besondere Kategorien personenbezogener Daten, Permalink, Abruf 18.05.2026.