Anthropic veröffentlichte Claude Haiku 4.5, ein latenzoptimiertes „kleines“ Modell mit einer ähnlichen Codierungsleistung wie Claude Sonnet 4. Das Unternehmen berichtet, dass Haiku 4.5 mehr als doppelt so schnell wie Sonnet 4 läuft und dabei ein Drittel der Kosten kostet. Es ist ab sofort über die API von Anthropic und in Partnerkatalogen auf Amazon Bedrock und Google Cloud Vertex AI verfügbar.

Der Preis für Haiku 4.5 beträgt 1 US-Dollar pro Million Input-Tokens und 5 US-Dollar pro Million Output-Tokens. Für Prompt-Caching betragen die aufgeführten Tarife 1,25 US-Dollar pro Million Schreib-Tokens und 0,10 US-Dollar pro Million Lese-Tokens.

Anthropic positioniert Haiku 4.5 für Workloads mit knappen Latenzbudgets und hohem Durchsatz, einschließlich Echtzeitassistenten, Kundensupport-Automatisierungen und Paarprogrammierung. Das Unternehmen empfiehlt es als Ersatz für Haiku 3.5 und Sonnet 4 bei kostensensiblen, interaktiven Workloads. Berichten zufolge übertrifft es Sonnet 4 bei „Computernutzungs“-Aufgaben, die GUI- und Browsermanipulation beinhalten, wie in Produkten wie Claude für Chrome zu sehen ist. Es verbessert auch die Reaktionsfähigkeit in Claude Code für Multi-Agent-Projekte und Rapid Prototyping.

Innerhalb der Modellpalette von Anthropic bleibt Sonnet 4.5 das Spitzenmodell des Unternehmens, das es als „das beste Codierungsmodell der Welt“ bezeichnet. Haiku 4.5 ist in der Lage, nahezu bahnbrechende Leistung bei größerer Kosteneffizienz zu bieten. Anthropic empfiehlt ein Orchestrierungsmuster, bei dem Sonnet 4.5 die mehrstufige Planung übernimmt und ein Pool von Haiku 4.5-Mitarbeitern die parallelisierte Ausführung verwaltet.

Entwickler können über die API von Anthropic über die Kennung claude-haiku-4-5 auf das Modell zugreifen. Während Anthropic bei der Markteinführung seine Verfügbarkeit auf Amazon Bedrock und Google Cloud Vertex AI bestätigte, weist das Unternehmen darauf hin, dass sich bestimmte Modellkatalog-IDs und regionale Abdeckung im Laufe der Zeit ändern können.

Anthropic lieferte Benchmark-Ergebnisse, um die Fähigkeiten des Modells zu demonstrieren. Beim SWE-Bench Verified erreichte Haiku 4.5 mit einem einfachen Gerüst mit Bash- und Dateibearbeitungstools eine Punktzahl von 73,3 %. Dieses Ergebnis wurde über 50 Versuche mit einem Denkbudget von 128.000 und ohne Testzeitberechnung gemittelt. Das Unternehmen teilte auch Ergebnisse von Terminal-Bench mit, die mit einem Terminus-2-Agenten in 11 Durchläufen getestet wurden, und von OSWorld-Verified, die mit einem Maximum von 100 Schritten in vier Durchläufen getestet wurden. Die Leistung bei AIME und MMMLU wurde auch anhand von Standardstichproben und 128K-Denkbudgets gemessen.

Das Unternehmen gab an, dass diese Ergebnisse eine Codierungsparität mit Sonnet 4 und Leistungssteigerungen bei Computernutzungsaufgaben unter den spezifischen Testgerüsten zeigen. Es empfiehlt Benutzern, Tests mit ihren eigenen Orchestrierungs- und Tool-Stacks zu replizieren, bevor sie die Leistung verallgemeinern. Das Modell wird unter der ASL-2-Lizenz veröffentlicht. In internen Tests berichtete Anthropic, dass Haiku 4.5 eine geringere gemessene Fehlausrichtungsrate aufwies als Sonnet 4.5 und Opus 4.1.