Sentiment-Analyse — Genauigkeits-Grenzen bei Ironie, Sarkasmus und Dialekt
Sentiment-Tools 2026 erreichen bei deutschen Standard-Texten typisch 70-85% Genauigkeit. Bei Ironie, Sarkasmus, regionalem Dialekt fallen sie auf 50-65%. Mandatsträger-Teams müssen wissen, wo die Werkzeuge zuverlässig sind und wo nicht — sonst werden falsche Krisen-Signale gemeldet.
Sentiment-Tools 2026 erreichen bei deutschen Standard-Texten typisch 70-85% Genauigkeit. Bei Ironie, Sarkasmus, regionalem Dialekt fallen sie auf 50-65%.[1] Mandatstraeger-Teams muessen wissen, wo die Werkzeuge zuverlaessig sind und wo nicht — sonst werden falsche Krisen-Signale gemeldet.
Drei Fehler-Klassen
— Ironie-Fehler. “Toller Vorschlag — jetzt fehlt nur noch die Realitaet” wird als positiv klassifiziert. Sentiment-Modelle erkennen die ironische Umkehrung schlecht.
— Sarkasmus-Fehler. Sarkasmus mit explizit-positivem Vokabular und implizit-negativer Bedeutung. Selbst LLM-basierte Modelle sind hier schwach.
— Dialekt-Fehler. Bayrisch, Saechsisch, Schwaebisch werden von deutschen Standard-Modellen schlechter klassifiziert.
Operative Konsequenzen
— Negative Sentiment-Spitzen manuell pruefen. Wenn ein Sentiment-Tool eine Krise meldet, mindestens 30 Sample-Beitraege manuell durchsehen, bevor der Mandatstraeger informiert wird.
— Multi-Modell-Voting. Zwei oder drei Sentiment-Tools parallel betreiben — wenn Modelle uneinig sind, Manual-Pruefung.
— Themen-spezifische Modelle. Generische Modelle versagen bei politischen Themen. Domain-adaptierte Modelle (z.B. fuer Mandatstraeger-Konversation) liefern bessere Werte.
Was Sentiment-Tools gut koennen
— Grobe Volumen-Trends ueber Tage/Wochen. — Aufdeckung neuer Themen (Themen-Clustering). — Vorklassifikation fuer manuelle Tiefen-Analyse.
Was Sentiment-Tools nicht koennen
— Einzelne Posts klassifizieren mit Belastbarkeit. — Krisen-Frueh-Warnung ohne menschliche Validierung. — Ironische/sarkastische Beitraege zuverlaessig erkennen.
Wo das hingehoert
Tiefe-1 Sentiment-Analyse: T1-C11. Sentiment-Tools Vergleich: T2-C11-01. Mandatstraeger-Routine: T2-C11-02.
Codex AI-Automation Sektion 11.
Quellen
ACL Anthology, Sentiment Analysis under Sarcasm — Multiple Studies, 2023-2024, Permalink, Abruf 18.05.2026.