Anthropic veröffentlichte sein neuestes KI-Modell, Claude Opus 4.7, das eine „bemerkenswerte Verbesserung“ gegenüber Opus 4.6 darstellt, jedoch „weniger umfassend leistungsfähig“ als die unveröffentlichte Opus Mythos Preview. Das neue Modell stärkt bestehende Stärken und konzentriert sich auf Codierung, Engineering und mehrstufige Aufgaben.
Claude Opus 4.7 zeigt überlegene Leistungen in der professionellen Wissensarbeit und behauptet, in anspruchsvollen Kontexten „gründlicher und konsistenter“ zu sein. Die Benchmarking-Tests des Modells beweisen seine Leistungsfähigkeit mit einem Ergebnis von 64,3 % bei der Agentencodierung auf SWE-bench Pro und SWE-bench Verified und erobern sich damit die Spitzenposition unter den öffentlich verfügbaren Modellen zurück.
Im Vergleich zu Opus 4.6 weist Opus 4.7 auch Verbesserungen bei der Verwendung von Agentencomputern und beim Denken auf Hochschulniveau auf. Es zeigt jedoch einen leichten Rückgang der Cybersicherheitsschwachstellenbewertungen und erreicht 73,1 % im Vergleich zu 73,8 % in der Vorgängerversion. Anthropic stellte fest, dass diese Änderung möglicherweise auf neue Sicherheitsmaßnahmen zurückzuführen ist, die darauf abzielen, risikoreiche Cybersicherheitsanfragen zu erkennen und zu blockieren.
Die Einführung von Claude Opus 4.7 scheint die Claude Mythos Preview zu bewerben, die in wichtigen Benchmarks eine überlegene Leistung gezeigt hat, derzeit jedoch nur ausgewählten Organisationen zur Verfügung steht. Anthropic betonte, dass die Cyber-Fähigkeiten von Opus 4.7 nicht mit denen von Mythos Preview übereinstimmen.
„Wir haben erklärt, dass wir die Veröffentlichung von Claude Mythos Preview begrenzt halten und neue Cyber-Sicherheitsmaßnahmen zunächst an weniger leistungsfähigen Modellen testen werden“, erklärte das Unternehmen. „Opus 4.7 ist das erste Modell dieser Art: Seine Cyber-Fähigkeiten sind nicht so weit fortgeschritten wie die von Mythos Preview.“
Claude Opus 4.7 ist ab sofort für alle Claude-Produkte und über die API des Unternehmens verfügbar, wobei die gleichen Preise wie bei den Vorgängermodellen gelten.








