DeepSeek kündigte am Samstag, kurz nach der Veröffentlichung seines V4-Großsprachenmodells am 24. April 2023, erhebliche Preissenkungen für seinen API-Dienst an. Der Preis senkt die niedrigeren Eingabe-Cache-Hit-Gebühren auf ein Zehntel ihrer vorherigen Gebühren und bietet bis zum 5. Mai 2023 einen Rabatt von 75 % auf das V4-Pro-Modell.
Der Hit-Preis für den Eingabe-Cache des V4-Pro ist auf 0,025 Yuan (ca. 0,0036 US-Dollar) pro Million Token gesunken. Die Standardpreise während des Aktionszeitraums betragen 3 Yuan für die Eingabe und 6 Yuan für die Ausgabe pro Million Token. Diese Preisstrategie unterbietet die Konkurrenz deutlich, wobei die Preise für Modelle von Anthropic, OpenAI und Google laut OpenRouter-Daten zwischen 12 und 25 US-Dollar pro Million Token liegen.
DeepSeek brachte V4-Pro und V4-Flash als Vorschau auf den Markt und markierte damit die erste bedeutende Modelleinführung des Unternehmens seit seiner Version V3.2 im Dezember 2022. V4-Pro verfügt über 1,6 Billionen Parameter und 49 Milliarden aktive Parameter pro Inferenzdurchgang und ist damit das größte derzeit verfügbare Open-Weight-Modell. V4-Flash verfügt über eine kleinere Konfiguration mit 284 Milliarden Parametern.
Schon vor den jüngsten Kürzungen lagen die Standardpreise von V4-Pro bei 1,74 US-Dollar für die Eingabe und 3,48 US-Dollar für die Ausgabe pro Million Token, was etwa 98 % niedriger war als die Preise für GPT-5.5 Pro von OpenAI. Die neuesten Rabatte bauen diesen Wettbewerbsvorteil noch weiter aus.
Angesichts der steigenden Kosten für Rechenleistung im KI-Sektor steht die Strategie von DeepSeek im Einklang mit einem breiteren Trend zu Preissenkungen in der Branche. Laut einem Bericht von Gelonghui hat das Unternehmen das Konzept der „KI-Preissenkung“ voll und ganz angenommen.
Bemerkenswert ist, dass V4 auf Huawei Ascend-Hardware anstelle von Nvidia-Chips läuft, was Beobachtern zufolge die Akzeptanz von KI-Systemen im Inland fördern könnte. Wei Sun, leitender KI-Analyst bei Counterpoint Research, wies darauf hin, dass diese Entwicklung den Einsatz von KI-Systemen ermöglicht, ohne sich ausschließlich auf Nvidia zu verlassen, was möglicherweise sowohl nationale als auch globale KI-Fortschritte beschleunigt.
V4-Pro weist eine erhebliche Effizienz auf und benötigt für ein Kontextfenster mit einer Million Token nur 27 % der Rechenleistung seines Vorgängers V3.2. Trotz seiner Fortschritte räumt DeepSeek ein, dass V4 hinsichtlich der Leistung etwa drei bis sechs Monate hinter führenden Modellen wie GPT-5.4 und Gemini 3.1 Pro zurückbleibt, wie im technischen Dokument des Unternehmens angegeben.








