Laut wöchentlichen Daten, die am 24. Februar 2026 veröffentlicht wurden, machen in China entwickelte große Sprachmodelle mittlerweile 61 % des gesamten Token-Verbrauchs auf OpenRouter aus, der weltweit größten LLM-API-Aggregationsplattform. Die drei am häufigsten verwendeten Modelle auf der Plattform wurden alle von chinesischen KI-Laboren entwickelt.
Mit 2,45 Billionen Token, die in einer einzigen Woche verbraucht wurden, belegte MiniMax M2.5 den Spitzenplatz, ein Anstieg von 197 % gegenüber der Vorwoche. Kimi K2.5 von Moonshot AI folgte mit 1,21 Billionen Token, obwohl seine Nutzung im Wochenvergleich um 20 % zurückging. GLM-5 von Zhipu AI belegte mit 780 Milliarden Token den dritten Platz, nachdem es um 158 % gestiegen war. DeepSeek V3.2 belegte unter allen Modellen auf der Plattform den fünften Platz. Zusammen machten chinesische Modelle 5,3 Billionen der 8,7 Billionen Token aus, die von den Top-10-Modellen der Plattform verbraucht wurden.
Der Anstieg der MiniMax M2.5-Nutzung war zum Teil auf den kostenlosen Zugang zu Werbeaktionen zurückzuführen. Kilo Code, ein KI-gestütztes Codierungstool, bot das Modell ab dem 12. Februar eine Woche lang kostenlos an. Cline, ein anderes Entwicklertool, führte eine ähnliche Aktion durch.
MiniMax M2.5 erreicht im SWE-Bench Verified 80,2 % und liegt mit 80,8 % nur einen Punkt hinter Claude Opus 4,6 von Anthropic.
Programmierung hat sich zur größten Einzelkategorie des Token-Verbrauchs auf OpenRouter entwickelt und wächst bis 2025 von 11 % auf über 50 % der gesamten Token. Agentengesteuerte Workflows, bei denen Modelle autonom mehrstufige Aufgaben ausführen, machen mittlerweile mehr als die Hälfte aller Ausgabe-Tokens auf der Plattform aus.
Chris Clark, COO von OpenRouter, erklärte, dass chinesische Open-Weight-Modelle bei Agentenströmen, die von US-Firmen betrieben werden, überproportional stark vertreten seien. Alle drei diese Woche am besten bewerteten chinesischen Modelle sind für Codierung und Agentenautomatisierung optimiert.
Die Kosten bleiben ein entscheidender Faktor. MiniMax M2.5 berechnet 0,30 $ pro Million Input-Tokens und 1,10 $ pro Million Output-Tokens. Der Preis für GLM-5 beträgt 0,30 US-Dollar pro Million Input-Tokens und 2,55 US-Dollar pro Million Output-Tokens. Im Vergleich dazu kostet Claude Opus 4.6 5 US-Dollar pro Million Input-Tokens und 25 US-Dollar pro Million Output-Tokens, was etwa 10 bis 20 Mal teurer ist.
Der gesamte wöchentliche Token-Verbrauch von OpenRouter hat etwa 12,1 Billionen erreicht, ein 12,7-facher Anstieg gegenüber dem Vorjahr. Die vom ehemaligen OpenSea-CTO Alex Atallah gegründete Plattform bietet ein einheitliches API-Gateway für mehr als 400 Modelle von über 60 Anbietern.
Andreessen Horowitz-Partner Martin Casado schätzt, dass etwa 80 % der Startups, die Open-Source-KI-Stacks verwenden, chinesische Modelle verwenden. MIT Technology Review berichtete, dass sich die Einführung chinesischer Open-Weight-Modelle im Silicon Valley beschleunigt.








