Der Grok-Chatbot von xAI hat das Datum der US-amerikanischen und israelischen Militärschläge gegen den Iran drei Tage vor ihrem Auftreten korrekt vorhergesagt. Die Vorhersage ergab sich aus einem am 25. Februar veröffentlichten Test der Jerusalem Post, bei dem vier KI-Modelle gefragt wurden, wann die Angriffe stattfinden würden.

Die Zeitung testete Claude von Anthropic, Gemini von Google, Grok von xAI und ChatGPT von OpenAI. Nur Grok identifizierte das korrekte Datum, den 28. Februar. Grok sagte „einen begrenzten US-Angriff am 28. Februar 2026“ voraus, während die anderen Modelle Daten Anfang März vorschlugen. Claude entschied sich für den 7. oder 8. März, Gemini prognostizierte den 4. bis 6. März und ChatGPT korrigierte seine Prognose auf den 3. März.

Die USA und Israel starteten die koordinierten Angriffe am 28. Februar, wie Grok vorhergesagt hatte. Israels Operation trug den Codenamen „Roaring Lion“ und die US-Operation hieß „Operation Epic Fury“. Präsident Donald Trump kündigte die Angriffe in einer Videoansprache an. Explosionen wurden aus Teheran, Isfahan, Qom, Karaj und Kermanshah gemeldet. Laut Associated Press und Reuters wurde Irans Oberster Führer Ayatollah Ali Khamenei bei den Angriffen getötet.

Der Iran startete Vergeltungsschläge gegen Israel und US-Einrichtungen in Bahrain, den Vereinigten Arabischen Emiraten und Katar. Elon Musk kommentierte die Vorhersage auf X mit den Worten: „Die Vorhersage der Zukunft ist der beste Maßstab für Intelligenz.“

Die Jerusalem Post bezeichnete die Übung als Stresstest und nicht als Prognosedienst. In dem Artikel wurde darauf hingewiesen, dass sich Groks Vorhersage auf öffentlich zugängliche Signale stützte, darunter diplomatische Gespräche in Genf und Trumps angekündigte Frist ab dem 19. Februar. Reuters berichtete damals, ein hochrangiger US-Beamter habe vorgeschlagen, Mitte März vor Ort zu sein, bevor alle Streitkräfte stationiert seien.

Die Jerusalem Post kam zu dem Schluss, dass die Roboter antworteten, als das Internet nach einem Date fragte.

Die Jerusalem Post veröffentlichte die Testergebnisse am 25. Februar. Die Zeitung gab an, dass ein stärkerer Druck auf die KI-Modelle zu spezifischeren Antworten führte, auch wenn sich die Klarheit in der realen Welt nicht verbesserte. Groks Vorhersage verbreitete sich schnell auf X durch Screenshots. Das Ergebnis kann entweder die analytische Fähigkeit oder den Zufall in einer Übung widerspiegeln, die darauf abzielt, die Grenzen der Modelle zu testen.


Quelle des hervorgehobenen Bildes