Anthropic startete Project Glasswing, eine Initiative, die sich auf den Schutz der globalen Software-Infrastruktur gegen KI-gesteuerte Cyber-Bedrohungen konzentriert, und stellte gleichzeitig sein KI-Modell Claude Mythos Preview vor.
Das Projekt Glasswing zielt darauf ab, die Fähigkeiten von Claude Mythos Preview zu nutzen, das fortgeschrittene Programmierfähigkeiten bewiesen hat und die der meisten erfahrenen menschlichen Sicherheitsexperten übertrifft. Das Modell identifiziert und nutzt Software-Schwachstellen aus und markiert damit eine bedeutende Weiterentwicklung der Cyber-Abwehrtechnologie.
In ersten Tests entdeckte Claude Mythos Preview Tausende von Zero-Day-Schwachstellen mit hohem Schweregrad in den wichtigsten Betriebssystemen und Webbrowsern. Zu den wichtigsten Erkennungserfolgen gehören eine 27 Jahre alte Schwachstelle in OpenBSD, eine 16 Jahre alte Schwachstelle in FFmpeg, die fünf Millionen automatisierte Tests überstanden hatte, und mehrere Schwachstellen im Linux-Kernel, die einen eskalierten Benutzerzugriff ermöglichten.
Alle identifizierten Schwachstellen wurden von den entsprechenden Entwicklern gemeldet und behoben. Um zu verhindern, dass böswillige Akteure diese Technologie ausnutzen, gründete Anthropic die Glasswing Coalition mit Gründungspartnern wie Amazon Web Services, Apple, Google, Microsoft, NVIDIA, Broadcom, Cisco, CrowdStrike, Palo Alto Networks, JPMorganChase und der Linux Foundation.
Im Rahmen seines Engagements stellt Anthropic seinen Partnern und 40 weiteren Organisationen, die kritische Infrastrukturen unterhalten, Nutzungsgutschriften für Mythos Preview in Höhe von 100 Millionen US-Dollar zur Verfügung. Darüber hinaus spendet Anthropic 4 Millionen US-Dollar an Open-Source-Sicherheitsorganisationen, darunter die Apache Software Foundation und OpenSSF.
Interne Auswertungen zeigen deutliche Verbesserungen der Leistungskennzahlen für Claude Mythos Preview. Im CyberGym-Benchmark erreichte das Modell 83,1 %, verglichen mit 66,6 % beim vorherigen Claude Opus 4.6. Beim SWE-Bench Verified Coding Test erreichte es eine Genauigkeit von 93,9 %, verglichen mit 80,8 % beim Vorgänger.
Anthropic wird Claude Mythos Preview aufgrund möglicher Risiken nicht allgemein verfügbar machen. Das Modell ist für defensive Sicherheitsanwendungen gedacht, einschließlich Penetrationstests und Sicherung von Endpunkten. Die Preisstruktur für Partner wird über AWS Bedrock und Vertex AI von Google Cloud auf 25 US-Dollar pro Million Input-Tokens und 125 US-Dollar pro Million Output-Tokens festgelegt.
Die Initiative beinhaltet die Verpflichtung, innerhalb von 90 Tagen öffentliche Ergebnisse zu melden. Anthropic führt derzeit Gespräche mit der US-Regierung über die Auswirkungen von Claude Mythos Preview auf die nationale Sicherheit. Elia Zaitsev, CTO von CrowdStrike, betonte die Dringlichkeit der Zusammenarbeit und bemerkte: „Die Zeitspanne zwischen der Entdeckung einer Schwachstelle und ihrer Ausnutzung ist zusammengebrochen. Das ist kein Grund, langsamer zu werden; es ist ein Grund, gemeinsam und schneller voranzukommen.“








