MiniMax M2.7 erreicht in Tests die besten Codierungs-Benchmarks

MiniMax veröffentlichte die Gewichte seines Modells MiniMax M2.7 am 12. April 2023 inmitten einer Welle von Veröffentlichungen offener Gewichte aus chinesischen Labors, die die wettbewerbsorientierte KI-Landschaft erheblich beeinflussten.

Diese Veröffentlichung steht im Einklang mit einem breiteren Trend in China, wo verschiedene Unternehmen sich beeilen, ihre Fortschritte vorzustellen. MiniMax M2.7 wurde erstmals im März angekündigt und erzielte im SWE-Pro-Benchmark einen Wert von 56,22 %, was den Ergebnissen von GPT-5.3-Codex entspricht. Darüber hinaus erreichte es 55,6 % beim VIBE-Pro-Benchmark, was bei der Projektabwicklung bei Web-, Mobil- und Simulationsaufgaben nahezu auf Augenhöhe mit Opus 4.6 liegt. Das Modell erhielt außerdem die höchste ELO-Bewertung von 1.495 bei der GDPval-AA-Bewertung unter den Open-Source-Modellen.

Die Gewichte von MiniMax M2.7 sind jetzt auf Hugging Face verfügbar und werden auf NVIDIA-Plattformen unterstützt. Die Veröffentlichung wurde jedoch aufgrund von Lizenzbeschränkungen kritisiert, die eine kommerzielle Nutzung ohne vorherige schriftliche Genehmigung verbieten, was nach Ansicht einiger Community-Mitglieder ihre Open-Source-Klassifizierung untergräbt. MiniMax charakterisierte M2.7 als das erste Modell, das durch einen Prozess, den sie „Selbstevolution“ nennen, an seinem eigenen Entwicklungszyklus teilnahm.

Die Veröffentlichung von MiniMax folgt auf die Open-Sourcing-Veröffentlichung seines GLM-5.1-Modells durch Zhipu AI am 7. April, das unter der MIT-Lizenz betrieben wird. Dieses Modell mit 754 Milliarden Parametern kann Engineering-Aufgaben bis zu acht Stunden lang autonom ausführen. Umgekehrt brachte Alibaba am 2. April sein proprietäres API-Modell Qwen 3.6 Plus auf den Markt, was Spekulationen über sein Engagement für Open-Source-Praktiken auslöste. Qwen 3.6 Plus war am 11. April noch kostenlos auf OpenRouter verfügbar, seine langfristige Verfügbarkeit bleibt jedoch ungewiss.

Die Vorfreude auf das V4-Modell von DeepSeek wächst, dessen Markteinführung Ende April erfolgen soll. DeepSeek-Gründer Liang Wenfeng gab an, dass das Modell auf den Ascend-Chips von Huawei laufen wird, was Chinas Bemühungen um Selbstversorgung mit Halbleitern unterstreicht. Es wird erwartet, dass V4 über etwa eine Billion Parameter verfügt und eine Mixture-of-Experts-Architektur mit einem Kontextfenster von einer Million Token nutzt. Darüber hinaus wird erwartet, dass es mehrere Varianten enthält, beispielsweise einen Vision-Modus für multimodale Unterstützung. Trotz zweier Verzögerungen deuten frühe Stresstests darauf hin, dass eine öffentliche Markteinführung unmittelbar bevorstehen könnte.

Quelle des hervorgehobenen Bildes

MiniMax M2.7 erreicht in Tests die besten Codierungs-Benchmarks

Related Stories

Apple bringt in Beta 3 weitere persönliche Siri-Sprachsteuerungen mit

Anthropische Studie zeigt, dass Claude-Modelle einen internen Arbeitsbereich bilden, der dem Bewusstsein ähnelt

Apple aktiviert Siri AI auf der Apple Watch in watchOS 27 Beta 3

Midjourney drängt Disney und andere, den internen KI-Einsatz in einer Klage offenzulegen