Wahrscheinlich... unwahr?

Wo KI spinnt, ist der Mensch in der Verantwortung

Large Language Models (LLM) sind keine Wahrheitsmaschinen, sondern Wahrscheinlichkeitssysteme. Obwohl das inzwischen weitgehend bekannt ist, werden LLM mit nahezu magischen Fähigkeiten assoziiert. Die Einführung des "Reasoning" verstärkt das, dabei evaluiert das Modell mit Wahrscheinlichkeitsberechnung, ob eine Antwort plausibel genug ist. Das verbessert die Ergebnisse, bleibt aber dem Raten näher als dem Wissen.

Darum hat KI Probleme mit Wahrheit

Eine Definition vorab: Wahrheit verstehe ich hier als eindeutig belegbar, durch seriöse Studien oder wiederholbare, klar berechnete Werte.

Aber genau dieser Definition von Wahrheit können LLM nicht entsprechen. Sie sind probabilistische, also wahrscheinlichkeitsbasierte Systeme, im Gegensatz zu deterministischer, also regelgebundener Software. Ein Taschenrechner liefert auf Basis eindeutiger mathematischer Gesetze immer dasselbe korrekte Ergebnis, bei 1+1 ebenso wie bei komplexen Rechenaufgaben.
Ebenso funktioniert Kryptografie: Der SHA-256-Wert eines Textes bleibt stabil, solange der Text unverändert bleibt; jede kleine Überarbeitung ändert den Wert vollständig. In deterministischen Systemen ist die Wahrheit durch Funktion und begrenzten Wirkbereich eingebaut.

LLM operieren ohne diese Grenzen. Die möglichen Anfragen sind unbegrenzt, ebenso die Trainingsgrundlage: Milliarden Datensätze ohne Prüfung auf Richtigkeit. Die Algorithmen berechnen Wahrscheinlichkeiten, keine Wahrheiten. Dieselbe Frage kann zu unterschiedlichen, gleichermaßen plausibel klingenden Antworten führen. Doch was plausibel klingt, ist nicht automatisch richtig. Das bekannteste Symptom dieses Strukturproblems ist das Halluzinieren.

Luka Peters

Ich schreibe Literatur - und über Literatur und Technologie. Mich interessiert, wie Digitalität Schreiben, Lesen, Denken und Lernen verändert.

Warum "Mehr Daten, mehr Hardware" keine Lösung ist

Wenn der Kirschkuchen nicht richtig gelungen ist, weil KI das Rezept fantasiert hat, ist das verschmerzbar. Halluzinierte Studien, medizinische Ratschläge oder politische Ereignisse sind dagegen ein ernsthaftes Problem.

KI-Unternehmen wie OpenAI oder Meta stellen das Problem der Halluzinationen als lösbar dar, mit mehr Trainingsdaten und besserer Hardware. Doch die Ursache des Problems liegt in der mathematischen Struktur von KI.

Schon 2024 haben unabhängig voneinander zwei Studien nachgewiesen, dass das Halluzinationsproblem der LLM nicht technisch lösbar ist. Das liegt an einem fundamentalen Prinzip der Mathematik: dem Halteproblem. Es wurde bereits 1936 durch Alan Turing bewiesen und besagt vereinfacht, dass kein Algorithmus generell prüfen kann, ob ein anderer Algorithmus zu einem korrekten Abschluss kommt oder überhaupt zu einem Ende findet. Auch für LLM gilt: Sie können ihre eigene Ausgabe nicht intern verifizieren. Mehr Daten und Hardware heben diese Grenze nicht auf.

Die Konsequenz: Zuverlässigkeit ist kein technisches Problem, das LLM irgendwann selbst lösen. Sie bleibt eine menschliche Aufgabe. Wer die Überprüfung an KI auslagert, riskiert nicht nur falsche Ergebnisse, sondern verliert sukzessive die Fähigkeit zur eigenständigen Recherche und zum selbstständigen Denken. Im besten Fall werden kritisches Lesen, Kontextualisieren und Verantwortung zur kulturellen Selbstverständlichkeit und professionellen Praxis.

Diese Blogserie begleitet dich durch den KI-Einsatz im Schreiben, pragmatisch, kritisch, ohne Hype. Direkt ins Postfach.

Transparenzhinweis:
Dieser Text wurde von mir geschrieben, mit KI herausgefordert und von mir finalisiert. Ich habe KI für Korrektur, Erklärungen zum Halteproblem und für die Titelfindung genutzt.