DeepSeek hat sein neues KI-Modell DeepSeek V4 auf den Markt gebracht und verspricht eine verbesserte Leistung, die für in China hergestellte Chips optimiert wurde. Das Modell verfügt über einen ultralangen Kontext von einer Million Wörtern, der die Fähigkeiten, das Weltwissen und die Argumentationsleistung der Agenten verbessert.

DeepSeek V4 ist in zwei Versionen verfügbar: DeepSeek V4-Pro und DeepSeek V4-Flash. Letzteres bezeichnet das Unternehmen als effizientere und wirtschaftlichere Variante. Laut DeepSeek übertrifft V4-Pro andere Open-Source-Modelle in weltweiten Wissensbenchmarks deutlich und wird nur geringfügig von Googles Closed-Source-Modell Gemini-Pro-3.1 übertroffen.

Die V4-Pro-Variante umfasst einen „Maximum-Argumentation-Effort-Modus“, der darauf ausgelegt ist, die Wissensfähigkeiten von Open-Source-Modellen zu verbessern und sie als Top-Anwärter in diesem Bereich zu etablieren. DeepSeek löste zuvor mit seinem früheren Modell R1 einen Billionen-Dollar-Ausverkauf an der Börse aus, das KI-Systeme wie ChatGPT von OpenAI zu geringeren Entwicklungskosten herausforderte.

Die Veröffentlichung von R1 im letzten Jahr führte zu erheblichen Verlusten für große Technologieunternehmen, wobei Nvidia an einem einzigen Tag über 500 Milliarden US-Dollar erlitt. Der Start markierte auch den ersten großen Wettbewerb eines chinesischen KI-Unternehmens gegen etablierte US-amerikanische Technologiegiganten. Die Veröffentlichung von DeepSeek erfolgt vor dem Hintergrund der US-Halbleiterexportbeschränkungen nach China, die insbesondere High-End-GPUs betreffen, die für die KI-Entwicklung unerlässlich sind.

Das für das Training von DeepSeek V4 verwendete Chipsystem wurde nicht bekannt gegeben, das Unternehmen gab jedoch an, dass es sowohl Nvidia- als auch Huawei-Chips unterstützt. DeepSeek V4 kann bis zu 384.000 Token verarbeiten, eine grundlegende Dateneinheit für KI-Modelle. Dies stellt eine deutliche Verbesserung gegenüber seinem Vorgänger V3 dar, der nur 128.000 Token verwaltete.

Das Upgrade ermöglicht die Argumentation mehrerer Dokumente, sodass die KI ganze Bücher und vollständige Codedatenbanken verstehen kann. Das Unternehmen behauptet, dass diese Fähigkeit einen „dramatischen Sprung in der Recheneffizienz“ darstellt und eine neue Ära für große Sprachmodelle mit Kontexten von einer Million Länge einleitet.

DeepSeek V4-Pro übertrifft Googles Gemini-3.1-Pro, bleibt aber immer noch hinter dem Claude Opus 4.6-Modell von Anthropic zurück. DeepSeek zielt darauf ab, die Intelligenz, Robustheit und Benutzerfreundlichkeit des Modells für verschiedene Aufgaben und Szenarien weiter zu verbessern.


Quelle des hervorgehobenen Bildes