Google hat Gemini 3.1 Flash-Lite auf den Markt gebracht, sein bisher schnellstes und günstigstes Gemini-3-Modell mit einem Preis von 0,25 US-Dollar pro Million Input-Tokens und 1,50 US-Dollar pro Million Output-Tokens.

Das Modell zielt auf hochvolumige Entwicklerarbeitslasten, Datenverarbeitung und Übersetzungsaufgaben ab. Es ist in der Vorschau über die Gemini-API in Google AI Studio und Vertex AI verfügbar, ist jedoch nicht in der Gemini-Consumer-App enthalten.

Im Vergleich zu Gemini 2.5 Flash-Lite ist die neue Version teurer, aber deutlich leistungsfähiger. Es übertrifft im Allgemeinen Gemini 2.5 Flash zu einem niedrigeren Preis.

Das Modell übertrifft Konkurrenten wie GPT-5 mini und Claude 4.5 Haiku. Grok 4.1 Fast ist günstiger, aber Gemini 3.1 Flash-Lite ist schneller und verspricht bis zu 363 Token pro Sekunde.

Bei multimodalen Benchmarks erzielte das Modell 1432 Elo-Punkte auf der Arena.ai-Bestenliste. Damit zählt es zu den Modellen mit offenem Gewicht und den kommerziellen Angeboten der letzten Generation.

Google hat für die Veröffentlichung keine Agent-Benchmarks veröffentlicht. Das Unternehmen gab an, dass das Modell für hochvolumige Aufgaben und die Datenverarbeitung gedacht sei und nicht für die Verwaltung von Agentenflotten.

Entwickler können die API verwenden, um die Argumentationszeit des Modells zur Kostenkontrolle zu optimieren. Niedrigere Argumentationseinstellungen erzeugen weniger Token, was für Workloads mit hohem Volumen relevant ist.

Dies ist die erste Flash-Lite-Version für Gemini 3.1. Google bringt traditionell zuerst leistungsfähigere Flash-Versionen auf den Markt oder lässt Flash-Lite ganz weg, wie es bei Gemini 3 der Fall war.

Google hat Gemini 3.1 Pro zwei Wochen zuvor auf den Markt gebracht. Das Unternehmen beschreibt Flash-Lite als für hochvolumige Entwickler-Workloads in großem Maßstab gedacht.


Quelle des hervorgehobenen Bildes