T2-C11-03 tactics

Sentiment-Analyse — Genauigkeits-Grenzen bei Ironie, Sarkasmus und Dialekt

Sentiment-Tools 2026 erreichen bei deutschen Standard-Texten typisch 70-85% Genauigkeit. Bei Ironie, Sarkasmus, regionalem Dialekt fallen sie auf 50-65%. Mandatsträger-Teams müssen wissen, wo die Werkzeuge zuverlässig sind und wo nicht — sonst werden falsche Krisen-Signale gemeldet.

Sentiment-Tools 2026 erreichen bei deutschen Standard-Texten typisch 70-85% Genauigkeit. Bei Ironie, Sarkasmus, regionalem Dialekt fallen sie auf 50-65%.^[1] Mandatstraeger-Teams muessen wissen, wo die Werkzeuge zuverlaessig sind und wo nicht — sonst werden falsche Krisen-Signale gemeldet.

Drei Fehler-Klassen

— Ironie-Fehler. “Toller Vorschlag — jetzt fehlt nur noch die Realitaet” wird als positiv klassifiziert. Sentiment-Modelle erkennen die ironische Umkehrung schlecht.

— Sarkasmus-Fehler. Sarkasmus mit explizit-positivem Vokabular und implizit-negativer Bedeutung. Selbst LLM-basierte Modelle sind hier schwach.

— Dialekt-Fehler. Bayrisch, Saechsisch, Schwaebisch werden von deutschen Standard-Modellen schlechter klassifiziert.

Operative Konsequenzen

— Negative Sentiment-Spitzen manuell pruefen. Wenn ein Sentiment-Tool eine Krise meldet, mindestens 30 Sample-Beitraege manuell durchsehen, bevor der Mandatstraeger informiert wird.

— Multi-Modell-Voting. Zwei oder drei Sentiment-Tools parallel betreiben — wenn Modelle uneinig sind, Manual-Pruefung.

— Themen-spezifische Modelle. Generische Modelle versagen bei politischen Themen. Domain-adaptierte Modelle (z.B. fuer Mandatstraeger-Konversation) liefern bessere Werte.

Was Sentiment-Tools gut koennen

— Grobe Volumen-Trends ueber Tage/Wochen. — Aufdeckung neuer Themen (Themen-Clustering). — Vorklassifikation fuer manuelle Tiefen-Analyse.

Was Sentiment-Tools nicht koennen

— Einzelne Posts klassifizieren mit Belastbarkeit. — Krisen-Frueh-Warnung ohne menschliche Validierung. — Ironische/sarkastische Beitraege zuverlaessig erkennen.

Wo das hingehoert

Tiefe-1 Sentiment-Analyse: T1-C11. Sentiment-Tools Vergleich: T2-C11-01. Mandatstraeger-Routine: T2-C11-02.

Codex AI-Automation Sektion 11.

Quellen

ACL Anthology, Sentiment Analysis under Sarcasm — Multiple Studies, 2023-2024, Permalink, Abruf 18.05.2026.