Z.ai, früher bekannt als Zhipu AI, hat am Dienstag das Modell GLM-5.1 veröffentlicht. Dieses Open-Source-Flaggschiffmodell ist für Agentic Engineering konzipiert und kann eine einzelne Codierungsaufgabe bis zu acht Stunden lang autonom bewältigen und dabei Planung, Ausführung, Tests und Optimierung in einer Endlosschleife durchführen.

Das GLM-5.1-Modell erzielte beim SWE-Bench Pro-Benchmark einen Wert von 58,4 und übertraf damit GPT-5.4, Claude Opus 4.6 und Gemini 3.1 Pro. Diese Veröffentlichung folgt einer Post-Training-Verfeinerung von GLM-5, das im Februar als Mixture-of-Experts-Modell mit 744 Milliarden Parametern eingeführt wurde, etwa 40 Milliarden aktive Parameter pro Token nutzt und vollständig auf Huawei Ascend-Chips ohne Nvidia-Hardware trainiert wurde.

Laut der Dokumentation von Z.ai verbessert GLM-5.1 die Codierungs- und Agentenfähigkeiten durch Techniken wie überwachte Multitasking-Feinabstimmung und verstärkende Lernphasen. Das Modell ist in der Lage, eine achtstündige autonome Ausführung aufrechtzuerhalten und dabei eine vollständige Schleife „Experimentieren – Analysieren – Optimieren“ abzuschließen. In Demonstrationen gelang es, innerhalb von acht Stunden erfolgreich ein komplettes Linux-Desktopsystem von Grund auf zu erstellen, 655 Iterationen auszuführen und den Abfragedurchsatz der Vektordatenbank um das 6,9-fache zu steigern.

GLM-5.1 verfügt über ein Kontextfenster mit 200.000 Token und unterstützt bis zu 128.000 Ausgabetoken. Es wurde für Agenten-Codierungs-Workflows optimiert und ist mit Tools wie Claude Code und OpenClaw kompatibel. Das Modell erreichte im KernelBench Level 3-Optimierungsbenchmark eine 3,6-fache geometrische mittlere Geschwindigkeitssteigerung bei realen Machine-Learning-Workloads.

GLM-5.1 steht allen Abonnenten des GLM Coding Plan zur Verfügung und seine Gewichtungen werden unter einer MIT-Lizenz veröffentlicht. Z.ai, das im Januar mit einem Wert von 31,3 Milliarden US-Dollar an die Hongkonger Börse ging, bietet API-Zugriff für GLM-5.1 zu einem Preis von 1,00 US-Dollar pro Million Input-Tokens und 3,20 US-Dollar pro Million Output-Tokens.

Die Einführung verschärft den Wettbewerb im Bereich der Open-Source-Codierungsmodelle und positioniert GLM-5.1 an der Spitze des SWE-Bench Pro vor seinen Closed-Source-Gegenstücken. Während Z.ai behauptet, dass die Fähigkeiten des Modells mit denen von Claude Opus 4.6 übereinstimmen, zeigen unabhängige Bewertungen, dass es etwa 94,6 Prozent des breiteren Coding-Scores von Opus 4.6 erreicht, was auf einige Lücken in der Argumentation und bei kreativen Aufgaben hinweist.


Quelle des hervorgehobenen Bildes