T1-C09 Grundlage 10 Min Lesezeit

Die Sieben-Stufen-Pipeline — von Plenarprotokoll zu TikTok in 30 Minuten

Quellenerfassung, Clipping-Kandidaten, Roh-Editing, Copy-Generierung, Human Review, Distribution, Performance-Loop. Die Industrie-Standard-Architektur 2026.

Die Bundestags-DIP-API stellt Plenarprotokolle im XML-Format innerhalb von Minuten nach Sitzungsende bereit.^[1] Wer eine Pipeline mit Whisper, einem LLM, FFmpeg und einem Distributions-Tool baut, schneidet einen Plenarrede-Clip in 30 Minuten. Wer es manuell macht, braucht vier Stunden. Im Algorithmus-Rennen liegt zwischen den beiden Zeiten 70 Prozent der möglichen Reichweite.^[2]

Was hier passiert

Der Plenarrede-Clip ist 2026 das wichtigste Standard-Asset der Mandatsträger-Kommunikation. Jeder erfolgreiche politische Account in Deutschland verarbeitet jede Sitzungswoche zwischen 30 und 50 dieser Clips. Wer es nicht maschinell macht, kann das Volumen nicht halten. Wer es nicht schnell macht, verliert den Algorithmus.

Die Architektur ist seit 2023 ausgereift. Sieben Stufen, jede mit eigenen Tools, jede mit klaren Kostengrößen. Die Pipeline ist nicht geheim — sie ist Industrie-Standard. Was sie unterscheidet, ist die Qualität der Hooks-Auswahl in Stufe zwei und der menschlichen Prüfung in Stufe fünf.

Diese sieben Stufen sind die Grundarchitektur. Sie wird in Codex AI-Automation mit Code-Templates ausgearbeitet und im Codex Fraktionsangebote Sektion 4 mit Preisrahmen unterlegt. Hier die Verdichtung.

Die Mechanik

Stufe eins: Quellenerfassung. Die Bundestags-DIP-API stellt Plenarprotokolle in XML bereit, durchsuchbar über Drucksachennummer, Datum, Sprecher.^[1] Seit der 19. Wahlperiode liegen Protokolle maschinenlesbar vor. Der Corpus der Bundestags-Plenarprotokolle (CPP-BT) von Seán Fobbe enthält alle Protokolle von der 1. bis zur aktuellen 21. Wahlperiode als XML.^[3] Parallel liefert die Bundestags-Mediathek das Video-Material. Eine Pipeline ruft beide Quellen ab — über offene Schnittstellen.

Tool-Stack: n8n oder Make für Orchestrierung. Python-Skripte für API-Calls. yt-dlp für Mediathek-Downloads. Eine vollautomatisierte Erfassung läuft in unter zehn Minuten ohne manuellen Eingriff.

Stufe zwei: Identifikation der Clipping-Kandidaten. Ein LLM scannt das Transkript nach vorab definierten Kriterien: emotionale Spitzen, zitierfähige Sätze, Konfliktmomente mit anderen Rednern, Anschlussfähigkeit an aktuelle Debatten außerhalb des Plenums. Output: ein Ranking der zehn bis zwanzig clipwürdigsten Momente, mit Zeitstempel und Begründung.

Tool-Stack: Claude (Anthropic), GPT-4 (OpenAI), Mistral oder Llama auf eigener Infrastruktur. Für DSGVO-Konformität: Enterprise-Tarif mit EU-Hosting oder Self-Hosted Open-Source-Modell. Siehe T1-C20 — DSGVO und KI. Prompt-Engineering entscheidet über die Qualität der Ranking-Liste — ein generischer Prompt liefert generische Kandidaten.

Stufe drei: Roh-Editing. FFmpeg-Pipelines extrahieren die Clips, formatieren sie auf 9:16 für TikTok und Reels, auf 1:1 für Feed-Posts, auf 16:9 für YouTube und LinkedIn. Whisper oder Deepgram erzeugt die Untertitel mit hoher Genauigkeit. Tools wie Submagic, Captions.ai und Opus Clip integrieren diesen Workflow.^[4] Submagic ab 16 US-Dollar pro Monat, Captions.ai ab 9 US-Dollar pro Monat, Opus Clip ab 19 US-Dollar pro Monat — die Marktpreise haben sich 2024 stabilisiert.

Stufe vier: Copy-Generierung. Ein LLM erzeugt für jeden Clip mehrere Caption-Varianten in unterschiedlichen Tonalitäten, plattformspezifische Hashtag-Sets, alternative Titel für YouTube Shorts. Anthropic Claude und OpenAI GPT sind die Standard-Tools, Mistral als europäische Alternative auf eigener Infrastruktur — n8n integriert alle drei nativ über vorgefertigte Nodes.^[5]

Stufe fünf: Human Review. Ein Mensch mit politischem Urteilsvermögen prüft die Vorschläge in fünf bis zehn Minuten pro Clip. Geht raus, modifiziert oder verwirft. Hier wird Compliance gegen das Abgeordnetengesetz geprüft — siehe T1-A02 — §55 Abs. 3 AbgG. Hier wird die Beleidigungs-Linie nach §188 StGB geprüft. Hier wird die parteiagnostische Tonalität geprüft. Dieser Filter wird nicht ausgeschaltet. Wer ihn ausschaltet, baut die nächste PR-Katastrophe.

Stufe sechs: Distribution. Geplant über Buffer, Hootsuite, Later oder Metricool. Plattformspezifische Posting-Zeiten, A/B-Testing der Thumbnails, Cross-Posting mit jeweils angepassten Captions. Buffer ab 6 US-Dollar pro Monat pro Plattform, Hootsuite ab 99 US-Dollar pro Monat, Metricool ab 18 Euro pro Monat. Wer Collab-Funktionen nutzt, multipliziert Reichweite über mehrere Accounts — siehe T1-A12 — Collab-Mechanik.

Stufe sieben: Performance-Loop. Daten fließen zurück, das Scoring-Modell lernt, welche Clip-Arten bei welcher Audience performen. Aus dem letzten Sitzungswochen-Datensatz wird der nächste Sitzungswochen-Prompt verbessert. Plattform-Analytics-Exports plus eigene Sheets oder ein dediziertes Dashboard — Looker Studio (kostenlos), Metabase (Open-Source), Mixpanel ab 24 US-Dollar pro Monat.

Geschwindigkeit ist die kritische Variable. Codex 02 dokumentiert: Wer in der ersten Stunde nach der Rede ausspielt, gewinnt den Algorithmus. Wer drei Stunden braucht, verliert 70 Prozent der möglichen Reichweite. Wer einen Tag braucht, ist tot.^[2] Die Pipeline-Architektur ist nicht Selbstzweck — sie ist Geschwindigkeit.

Drei Beispiele

Erstes Beispiel: Heidi Reichinneks Brandmauer-Cut, 29. Januar 2025. Die Rede endete am späten Vormittag, der Cut auf TikTok erschien am Nachmittag desselben Tages. Pipeline-Mechanik: schneller Schnitt auf den emotionalen Höhepunkt, vertikales Format, Untertitel im oberen Drittel, harte Hook in den ersten zwei Sekunden. Erreichte über 30 Millionen Aufrufe.^[6] Lehrstück für die Stunden-eins-Mechanik — siehe T1-A03 — Plenarrede zu 30 Millionen.

Zweites Beispiel: AfD-Bundestagsfraktion. Die Fraktion betreibt seit 2022 eine systematische Plenarclip-Pipeline. Drei AfD-Spitzenvideos in den Top 10 der gesamten Wahlperiode 2025 laut CeMAS-Monitoring.^[7] Mechanik: hohe Frequenz (mehrere Clips pro Sitzungstag), konsistente Schnitt-Logik, harte Hook auf Konfrontation. Lehrstück für die Mengen-Wirkung der Pipeline — eine Partei mit 200 Clips pro Monat schlägt eine Partei mit 20 Clips, auch wenn die 20 jeweils besser sind.^[8]

Drittes Beispiel: Bundeskanzler-Account unter Friedrich Merz, ab Mai 2025. Ein achtköpfiges Social-Media-Team produziert für den persönlichen Account und den Kanzler-Account parallel. Pipeline ist dieselbe wie für Mandatsträger-Accounts — aber mit Regierungssprecher-Freigabe in Stufe fünf. Über zwei Millionen Instagram-Follower für den Kanzler-Account.^[9] Lehrstück für die Skalierung über Rollen-Ebenen hinweg.

Drei verschiedene Lager — Linke, AfD, CDU. Dieselbe Sieben-Stufen-Architektur. Was unterscheidet, ist die Geschwindigkeit in Stufe drei und die Qualität in Stufe fünf.

Was schief gehen kann

Drei wiederkehrende Failure-Modes.

Erstens, die Stufe-fünf-Verkürzungs-Falle. Wer die menschliche Prüfung wegautomatisiert, lässt LLM-Halluzinationen oder fehlende Kontext-Sensitivität durchgehen. LLMs erfinden manchmal Zitate, vertauschen Sprecher oder verkürzen Aussagen sinnentstellend. Ohne den menschlichen Filter veröffentlicht die Pipeline früher oder später eine erfundene Aussage eines realen Politikers — siehe §188 StGB, §187 StGB. Das ist das einzige nicht verhandelbare Glied der Pipeline.

Zweitens, die DSGVO-Falle in Stufe zwei und vier. Wer ein LLM mit Plenarrede-Transkripten füttert, verarbeitet personenbezogene Daten der Sprecher (Mandatsträger). Diese sind nach Mandatsverhältnis öffentlich, aber: Kommentare unter Posts mit Bürger-Profilen fallen unter Artikel 9 DSGVO. Eine Pipeline, die Bürger-Kommentare einfließen lässt, braucht eine andere Architektur — Anonymisierung oder Self-Hosting. Siehe T1-C20 — DSGVO und KI.

Drittens, die Compliance-Falle in Stufe sechs. Fraktions-Accounts müssen den parlamentarischen Anker im Post sichtbar machen — Drucksachennummer, Sitzungsnummer, Datum. Eine automatisierte Distribution, die diesen Anker weglässt, generiert §55-Abs.-3-Verstöße im industriellen Maßstab. Die netzpolitik-Stichprobe vom Februar 2025 hat 201 solcher Verstöße in 30 Tagen dokumentiert.^[10] Siehe T1-A01 — Fraktionsposts gegen das Abgeordnetengesetz.

Eine vierte, kostspielige Falle: die Tool-Sammlung-Falle. Wer Submagic plus Captions.ai plus Opus Clip plus n8n plus Buffer plus Metabase parallel laufen lässt, hat 200 bis 400 Euro pro Monat Tool-Kosten — ohne dass jedes Tool seine spezifische Stärke ausspielt. Die richtige Architektur 2026 verwendet zwei bis drei spezialisierte Tools plus n8n als Klebeband, nicht zehn parallele SaaS-Konten.^[5]

Personal-Stack für eine voll arbeitende Pipeline: zwei bis vier Vollzeitkräfte — ein Editor mit politischem Verständnis, ein Stratege oder Reviewer, ein technischer Lead, optional ein Captioning- und Distributions-Spezialist. Output-Volumen: 30 bis 50 hochwertige Clips pro Sitzungswoche, das drei- bis fünffache eines klassischen manuellen Workflows.^[2]

Wo das hingehört

Die LLM-Architektur für konsistente Parteipositionen: T1-C10 — LLM-Assistenten. Das Sentiment-Layer auf Kommentare: T1-C11 — Sentiment-Analyse. Die Reichinnek-Fallanalyse als Anwendungsbeispiel der Pipeline: T1-A03 — Plenarrede zu 30 Millionen.

Codex AI-Automation und Implementierung hat die Pipeline mit Code-Templates, n8n-Workflow-Konfigurationen und vollständigem Tool-Vergleich.

Was du als nächstes tust

Heute lädst du das letzte Plenarprotokoll deines Mandatsträgers über die DIP-API als XML herunter. Wenn du nicht weißt, wie das geht, ist das Stufe-eins-Problem — die Lösung steht im Bundestag-Open-Data-Handbuch.

Im zweiten Schritt schreibst du einen einfachen LLM-Prompt für Stufe zwei: “Identifiziere aus diesem Plenarprotokoll die zehn clipwürdigsten Momente. Pro Moment: Zeitstempel, Sprecher, ein Satz Begründung.” Wenn das LLM brauchbare Ergebnisse liefert, läuft die Pipeline-Grundlage. Wenn nicht, ist Prompt-Engineering der nächste Schritt.

Quellen

Deutscher Bundestag, DIP — Dokumentations- und Informationssystem für Parlamentarische Vorgänge — API, Permalink Hilfe-API, Abruf 17.05.2026.
Codex 02 — Fraktionsangebote, Sektion 4 (Plenardebatten-Clipping mit Geschwindigkeits-Daten und Personal-Stack), Stand Mai 2026, interne Quelle Schreiner Content Systems.
Fobbe, Seán, Corpus der Plenarprotokolle des Deutschen Bundestages (CPP-BT) — 1. bis 21. Wahlperiode in XML, Permalink, Abruf 17.05.2026.
OpusClip Blog, The Ultimate 24/7 Content Machine — Using OpenClaw to Run Your Entire OpusClip Workflow, Permalink, Abruf 17.05.2026.
n8n, AI Agent integrations und Workflow Templates — n8n-Workflow-Bibliothek mit über 9.000 Templates für LLM, Whisper, Distribution, Permalink, Abruf 17.05.2026.
Wikipedia, Heidi Reichinnek — Biographie, Stand 17.05.2026, Permalink, Abruf 17.05.2026.
CeMAS, Bundestagswahl 2025 Monitoring, Permalink, Abruf 17.05.2026.
Konrad-Adenauer-Stiftung, 1 Swipe to Power — Was der Bundestagswahlkampf über TikTok lehrt, KAS-Politsnack, Mai 2025, Permalink (PDF), Abruf 17.05.2026.
BASECAMP, Bundestagswahl 2025: Die Social-Media-Kommunikation der Spitzenkandidaten, Permalink, Abruf 17.05.2026.
Schwarzbeck, Martin, Analyse zur Bundestagswahl 2025 — Illegale Wahlwerbung mit Steuergeld, netzpolitik.org, 13.02.2025, Permalink, Abruf 17.05.2026.