EN Login

LLM-Assistenten für Parteipositionen — wie eine Partei konsistent bleibt

Trainierter Assistent mit Wahlprogramm, Anträgen, MdB-Profilen. Verhindert inkonsistente Aussagen. Implementierung trivial mit Claude Projects oder einer eigenen RAG-Pipeline.

Eine deutsche Bundestagspartei hat zwischen 80 und 200 Drucksachen pro Jahr, ein Wahlprogramm zwischen 80 und 300 Seiten und mehrere hundert MdB-Pressemitteilungen pro Woche. Kein Mensch hält das im Kopf konsistent. Eine RAG-Pipeline tut es — und macht aus Sprecher-Inkonsistenzen ein lösbares Problem statt einer Tagessstruktur.

Was hier passiert

Retrieval Augmented Generation, kurz RAG, ist die Standard-Architektur 2026 für domänenspezifische LLM-Anwendungen. Statt das Sprachmodell selbst mit Daten zu trainieren — teuer, langsam, schwer zu aktualisieren — verbindet RAG das Modell mit einer durchsuchbaren Wissensbasis. Bei jeder Anfrage werden relevante Dokumente aus der Wissensbasis abgerufen und in den Prompt eingebunden. Das Modell antwortet auf Basis dieser Dokumente, nicht aus seinem eigenen Trainingsdatensatz.[1]

Für politische Parteien ist das die richtige Architektur, weil drei Anforderungen zusammenkommen. Erstens: die Wissensbasis ändert sich wöchentlich — neue Anträge, neue Pressemitteilungen, neue Position-Statements. Zweitens: die Antworten müssen quellengestützt sein — eine Pressesprecherin braucht Drucksachennummern, kein erfundenes Modell-Wissen. Drittens: die Konsistenz gegenüber bestehenden Aussagen muss prüfbar sein — Modell-Halluzinationen können einen Mandatsträger juristisch und politisch in Probleme bringen.

Eine RAG-Pipeline löst alle drei. Die Implementierung ist 2026 trivial im Vergleich zu 2022 — Claude Projects (Anthropic), GPT-4 Custom GPTs (OpenAI), oder eine eigene Pipeline mit Vector-Datenbank lassen sich in Tagen aufsetzen.

Die Mechanik

Fünf Komponenten einer politischen RAG-Pipeline.

Erste Komponente: Datenbasis. Alle Fraktionspositionen, Drucksachen, Kleine Anfragen, Plenarreden der letzten Jahre werden in einem strukturierten Format zusammengefasst. PDF, Word, Markdown — der Importer nimmt alles. Die Bundestags-DIP-API liefert maschinenlesbar Drucksachen seit der 19. Wahlperiode.[2] Der CPP-BT-Corpus von Seán Fobbe liefert alle Plenarprotokolle ab 1949 in XML.[3] Pressemitteilungen werden über RSS oder direkte API-Abfragen integriert.

Zweite Komponente: Embedding und Vector-Datenbank. Jedes Dokument wird in semantische Vektoren übersetzt — kleine numerische Repräsentationen, die Bedeutung kodieren.[1] OpenAI text-embedding-3-small (kostengünstig), text-embedding-3-large (höhere Qualität), Cohere Embed v3 oder lokale Modelle wie sentence-transformers. Vector-Datenbank-Optionen: Pinecone (SaaS, ab 70 US-Dollar pro Monat), Weaviate (Open-Source, selbst gehostet), Qdrant (Open-Source, sehr schnell), pgvector (PostgreSQL-Erweiterung, einfachste Integration).

Dritte Komponente: Retrieval-Layer. Eine Anfrage in natürlicher Sprache — “Wie hat unsere Fraktion zum Bürgergeld 2024 abgestimmt und was war die Begründung?” — wird in einen Vektor übersetzt. Die Vector-Datenbank gibt die ähnlichsten Dokumente zurück. Default: die fünf bis zehn relevantesten Treffer, mit Quellenangabe.

Vierte Komponente: Prompt-Generierung. Die abgerufenen Dokumente werden in den Modell-Prompt eingebunden, zusammen mit der ursprünglichen Frage. Das Modell antwortet ausschließlich auf Basis dieser Dokumente. Eine zentrale Anweisung im System-Prompt: “Beantworte nur, was du in den bereitgestellten Quellen findest. Wenn die Quellen keine Antwort enthalten, sage das.” Damit reduziert sich die Halluzinations-Rate dramatisch.

Fünfte Komponente: Output-Validierung. Vor jeder Veröffentlichung läuft eine Plausibilitäts-Prüfung — automatisch oder manuell. Stimmen die zitierten Drucksachennummern? Existieren die referenzierten Anträge? Wenn ja: Freigabe. Wenn nein: zurück zum Retrieval-Layer mit verfeinerter Suche.

Für die Implementierung gibt es drei Spuren.

Spur eins: Claude Projects. Anthropic erlaubt seit 2024, dass Nutzer mehrere Dokumente in ein “Project” hochladen, das dann als Kontext für jede Konversation verwendet wird.[4] Setup-Zeit: Minuten. Geeignet für bis zu etwa 200.000 Tokens Kontext. Vorteil: keine Vector-Datenbank-Wartung, native Claude-Tonalität. Nachteil: Limit der Token-Größe und Abhängigkeit von Anthropic.

Spur zwei: OpenAI Custom GPTs. Vergleichbar mit Claude Projects, aber über die GPT-Store-Architektur. Setup-Zeit: Stunden. Geeignet für bis zu etwa 128.000 Tokens Kontext. Vorteil: weite Verbreitung, einfache Integration in bestehende OpenAI-Pipelines.

Spur drei: Eigene RAG-Pipeline. Vector-Datenbank plus Embedding-Modell plus LLM. Setup-Zeit: ein bis zwei Wochen für eine Standard-Implementierung. Tool-Stack: LangChain oder LlamaIndex als Framework, Pinecone oder Qdrant als Datenbank, OpenAI oder Anthropic oder Mistral als LLM. Vorteil: volle Kontrolle, beliebig skalierbar, DSGVO-konform über Self-Hosting. Nachteil: Wartung erforderlich, höherer initialer Aufwand.

Die akademische Forschung dokumentiert: ein Graph-augmentierter RAG-Ansatz, das sogenannte PG-RAG-Framework, hat in einer Studie zum Schweizer Parlament gezeigt, dass die Integration von strukturierten politischen Beziehungen (Co-Sponsorings, Ausschuss-Zugehörigkeiten, Parteiblöcke) die Vorhersagequalität für MP-Positionen signifikant verbessert.[5] Für deutsche Parteien adaptierbar — die Bundestags-Drucksachen liefern Co-Sponsorings nativ.

Drei Beispiele

Erstes Beispiel: Pressesprecher-Briefings. Eine Pressesprecherin steht vor einem Interview und muss in zehn Minuten ein Briefing zu einem aktuellen Thema haben. Mit einer RAG-Pipeline tippt sie das Thema ein, erhält in unter einer Minute eine Zusammenfassung der eigenen Fraktionsposition mit Drucksachennummern, vergangenen Plenarreden des Mandatsträgers und der aktuellen Bundesregierungsposition. Ohne Pipeline: 30 Minuten Eigenrecherche in mehreren Datenbanken. Spart pro Pressesprecherin und Jahr 40 bis 60 Arbeitstage.[6]

Zweites Beispiel: Konsistenzprüfung vor Veröffentlichung. Eine Mandatsträgerin entwirft einen Tweet zur Migrationspolitik. Bevor der Tweet rausgeht, läuft er durch eine RAG-Pipeline, die ihn gegen die bestehende Fraktionsposition prüft. Output: “Diese Aussage steht in Spannung zu Drucksache BT-Drs. 20/12345 vom 14.03.2025, in der die Fraktion X gefordert hat. Anpassung empfohlen.” Das ist Compliance-Hygiene, die in Echtzeit funktioniert.

Drittes Beispiel: Mitarbeiter-Onboarding. Eine neue wissenschaftliche Mitarbeiterin im MdB-Büro hat in der ersten Woche tausend Fragen — zur Fraktionsposition, zu Anträgen, zu vergangenen Reden des MdB, zu Compliance-Linien. Eine RAG-Pipeline ist die schnellste Antwortquelle. Ohne Pipeline: zwei Wochen Einarbeitung über Aktenstudium. Mit Pipeline: drei Tage. Die Onboarding-Zeit halbiert sich. Siehe Codex AI-Automation für die volle Wirtschaftlichkeits-Rechnung.

Drei Anwendungsfälle, drei verschiedene Nutzer-Profile, dieselbe Architektur.

Bonus-Anker: PG-RAG-Framework der Schweizer Parlamentsanalyse. Akademische Forschung dokumentiert messbare Verbesserung der politischen Positions-Vorhersage durch Integration von Parlamentsgrafen.[5] Für deutsche Mandatsträger-Büros bisher nicht systematisch adaptiert — eine offene Marktlücke.

Was schief gehen kann

Drei wiederkehrende Failure-Modes.

Erstens, die Hallu­zinations-Falle. Wenn die System-Prompt-Anweisung “Beantworte nur, was du in den Quellen findest” nicht streng genug formuliert ist, ergänzt das Modell aus seinem allgemeinen Training. Ein erfundener Drucksachen-Verweis ist ein juristisches Risiko und ein politisches. Best Practice 2026: jeder Output nennt seine Quellen, jede Quellenangabe wird automatisch gegen die Datenbank validiert.

Zweitens, die DSGVO-Falle bei Mitarbeiter-Daten. Eine RAG-Pipeline, die interne E-Mails, persönliche Mitarbeiter-Profile oder unveröffentlichte Strategie-Dokumente indexiert, verarbeitet personenbezogene Daten. Wenn das LLM extern liegt (OpenAI, Anthropic, Google) und kein DSGVO-konformer Auftragsverarbeitungsvertrag besteht, ist die Architektur rechtswidrig. Siehe T1-C20 — DSGVO und KI. Empfehlung für hochsensible Datenbasen: Self-Hosted Open-Source-Modell (Llama 3, Mistral), Vector-Datenbank auf eigenen Servern (Qdrant, pgvector).

Drittens, die Aktualisierungs-Falle. Eine RAG-Pipeline ist nur so gut wie ihre Datenbasis. Wenn neue Drucksachen, Pressemitteilungen und Plenarreden nicht regelmäßig indexiert werden, antwortet die Pipeline auf Stand X vom letzten Quartal — und liefert obsolete Positionen. Automatisierte Update-Mechanik ist Pflicht. n8n-Workflows können DIP-API plus interne CMS plus Vector-DB täglich synchronisieren — Setup-Zeit ein bis zwei Tage.[7]

Eine vierte Falle: die Personality-Konsistenz. Ein RAG-Output spricht im Default-Tonfall des LLM. Wer ihn ohne Stil-Anpassung verwendet, klingt nicht wie der Mandatsträger. Lösung: System-Prompt mit Stil-Anweisungen plus Few-Shot-Beispiele aus eigenen Reden. Stil-Konsistenz ist trainierbar, aber sie ist kein Default.

Wo das hingehört

Die Pipeline-Mechanik, in die LLMs eingebettet sind: T1-C09 — Sieben-Stufen-Pipeline. Die Wahlkreis-Analytik-Anwendung von RAG: T1-C16 — Wahlkreis-Analytics. Die rechtliche Grundlage für LLM-Einsatz mit personenbezogenen Daten: T1-C20 — DSGVO und KI.

Codex AI-Automation und Implementierung hat die RAG-Pipeline-Architektur mit Code-Templates, Vector-DB-Vergleichen und konkreten Implementierungs-Beispielen.

Was du als nächstes tust

Heute legst du in einem Anthropic-Claude-Account oder OpenAI-ChatGPT-Account ein Projekt an. Lädst die letzten zehn Pressemitteilungen deiner Fraktion plus das aktuelle Wahlprogramm hoch. Tippst eine konkrete Frage ein — “Was ist unsere Position zur Energiepolitik 2026?” — und schaust auf die Antwort.

Wenn die Antwort substanzhaltig ist und Quellen nennt, läuft das Prinzip. Wenn die Antwort generisch ist, fehlt System-Prompt-Anweisung. Wenn die Antwort halluziniert, fehlt das “Beantworte nur, was du in den Quellen findest”-Constraint. In allen drei Fällen ist das Setup in unter einer Stunde stabilisierbar.

Quellen

  1. Prompt Engineering Guide, Retrieval Augmented Generation (RAG) für LLMs, Permalink, Abruf 17.05.2026.

  2. Deutscher Bundestag, DIP — API-Dokumentation, Permalink, Abruf 17.05.2026.

  3. Fobbe, Seán, Corpus der Plenarprotokolle des Deutschen Bundestages (CPP-BT) — 1. bis 21. Wahlperiode in XML, 2025, Permalink, Abruf 17.05.2026.

  4. Fraunhofer IESE, Retrieval Augmented Generation (RAG): Chat mit eigenen Daten, Permalink, Abruf 17.05.2026.

  5. arXiv, Graph-Augmented LLMs for Swiss MP Ideology Prediction — PG-RAG-Framework, Permalink, Abruf 17.05.2026.

  6. Codex 02 — Fraktionsangebote, Sektion 10 (Pressearbeit-Boost mit LLM-Drafting, Spar-Daten 40-60 Arbeitstage pro Pressesprecher und Jahr), Stand Mai 2026, interne Quelle Schreiner Content Systems.

  7. n8n, AI Agent integrations und Workflow Templates, Permalink, Abruf 17.05.2026.