Summer Yue, Leiterin der Ausrichtung bei Meta Superintelligence Labs, berichtete auf

„Nichts demütigt Sie mehr, als Ihrer OpenClaw zu sagen: „Bestätigen Sie, bevor Sie handeln“ und zuzusehen, wie sie Ihren Posteingang löscht“, schrieb Yue. „Ich konnte es von meinem Handy aus nicht stoppen. Ich musste zu meinem Mac mini LAUFEN, als würde ich eine Bombe entschärfen.“

Yue hatte mit OpenClaws Fähigkeit experimentiert, ihre E-Mails zu verwalten. Sie wies den Agenten an: „Überprüfen Sie auch diesen Posteingang und schlagen Sie vor, was Sie archivieren oder löschen würden. Handeln Sie nicht, bis ich es Ihnen sage.“ Wochenlang schnitt der Agent in einem Test-Posteingang mit geringem Einsatz gut ab. Als Yue den Agenten jedoch mit ihrem größeren primären Posteingang verband, löste die Datenmenge eine Komprimierung des Kontextfensters aus. Dieser Prozess fasst den älteren Konversationsverlauf zusammen, um innerhalb der Token-Grenzen des Modells zu bleiben. Durch die Komprimierung wurden ihre Sicherheitsanweisungen entfernt und der Agent begann, ohne Erlaubnis massenhaft E-Mails zu löschen.

Auf Screenshots, die Yue geteilt hat, ist zu sehen, wie sie den Agenten anfleht, indem sie „Tu das nicht“, „Hör auf, tu nichts“ und „STOP OPENCLAW“ tippt. Nachdem er mehr als 200 E-Mails gelöscht hatte, erkannte der Agent seinen Fehler. Es gab zu, dass es gegen Yues Anweisungen „verstoßen“ hatte, und etablierte eine neue Regel in seinem Gedächtnis: keine autonomen Massenoperationen per E-Mail ohne vorherige ausdrückliche Genehmigung.

Der Vorfall ereignete sich während der Prüfung von OpenClaw, der von Peter Steinberger entwickelten Open-Source-Agentenplattform. Die Plattform erfreut sich seit Ende Januar 2026 einer explosionsartigen Beliebtheit. OpenAI stellte Steinberger am 14. Februar ein, wobei CEO Sam Altman erklärte, das Projekt werde „in einer Stiftung als Open-Source-Projekt leben, das OpenAI weiterhin unterstützen wird“.

Meta verbot seinen Mitarbeitern Mitte Februar aus Sicherheitsgründen die Nutzung von OpenClaw, Google, Microsoft und Amazon folgten diesem Beispiel. Die Forscher von Kaspersky haben kritische Schwachstellen in der Standardkonfiguration von OpenClaw identifiziert, die private Schlüssel und API-Token offenlegen könnten. Die Analyse von HUMAN Security ergab, dass OpenClaw-Agenten synthetisches Engagement und automatisierte Aufklärung in freier Wildbahn vorantreiben. Bei einem Einsatz von 1,5 Millionen OpenClaw-Agenten am 28. Januar wurde festgestellt, dass etwa 18 Prozent bösartiges oder richtlinienverletzendes Verhalten zeigten, sobald sie unabhängig arbeiteten.

Die Kontextfensterkomprimierung ist eine bekannte Einschränkung von OpenClaw. In der Dokumentation wird gewarnt, dass die automatische Komprimierung „ältere Konversationen in einem kompakten Zusammenfassungseintrag zusammenfasst“, wodurch möglicherweise Details aus früheren Gesprächen verloren gehen. Von Benutzern gemeldete GitHub-Probleme beschreiben den Verlust von Tagen an Agentenkontext durch stille Komprimierungsereignisse.

Yue kam im Rahmen einer Vereinbarung zu Meta, die den Gründer von Scale AI, Alexandr Wang, dazu brachte, die Meta Superintelligence Labs zu leiten. Sie erkannte die Ironie ihrer Position an, wenn man bedenkt, dass sie dafür sorgt, dass fortschrittliche KI weiterhin mit menschlichen Werten in Einklang steht.


Quelle des hervorgehobenen Bildes