EBU-Studie unter Beteiligung von ARD und ZDF: KI-Assistenten geben oft fehlerhafte Nachrichten aus


Fast die Hälfte der von KI-Assistenten gelieferten Nachrichten enthält Fehler, zeigt eine internationale Studie.
Die am 22. Oktober 2025 veröffentlichte Untersuchung „News Integrity in AI Assistants“ (PDF) der Europäischen Rundfunkunion (EBU) analysierte über 3.000 KI-Antworten. Beteiligte öffentlich-rechtliche Sender stammen aus Ländern wie Deutschland, Frankreich, Kanada, Schweden, Spanien und den USA, unter Federführung der BBC.
Zentrale Ergebnisse: 45 Prozent aller Antworten enthielten mindestens einen erheblichen Fehler, 31 Prozent wiesen Probleme bei den Quellenangaben auf, und 20 Prozent waren ungenau, halluziniert oder veraltet. Laut ZDF-Intendant Himmler zeigt die Studie die Notwendigkeit, KI-Inhalte kontinuierlich zu prüfen und betont die Rolle öffentlich-rechtlicher Medien für verlässliche Informationen.
Maßnahmen und Empfehlungen zur KI-Genauigkeit
Die EBU veröffentlichte ein „Toolkit zur Genauigkeit bei KI-Assistenten“ (PDF), das Verbesserungsvorschläge für Anbieter und Hinweise zur Förderung der Medienkompetenz bei Nutzenden enthält. Laut ARD-Vorsitzendem Hager sollen Mechanismen etabliert werden, die falsche oder missverständliche Informationen verhindern und einen regulierten Zugang zu vertrauenswürdigen Inhalten sicherstellen.
Kernpunkte der Studie:
- Fehlerquote bei KI-Antworten: 45 Prozent
- Probleme mit Quellenangaben: 31 Prozent
- Ungenauigkeiten, Halluzinationen, veraltete Infos: 20 Prozent
- Toolkit zur Verbesserung der KI-Genauigkeit veröffentlicht
- EU und nationale Behörden sollen bestehende Gesetze durchsetzen
Die EBU fordert eine kontinuierliche, unabhängige Überwachung von KI-Systemen. Die Studie baut auf einer BBC-Untersuchung vom Februar 2025 auf und bestätigt die international verbreiteten Probleme bei KI-generierten Nachrichteninhalten.
Die Tatsache, dass die Branche trotz der hohen Fehlerquote aktiv versucht, vertrauenswürdige Wege für die Nutzung von KI zu entwickeln, anstatt die Technologie einfach zu meiden, finde ich positiv.
-->
Der Vergleich zu den größeren Models aus den Bezahlversionen wäre interessant gewesen, also ob die Fehlerquote dort niedriger ist. Aber man kann natürlich nicht alles untersuchen.