Mit der Veröffentlichung von GPT-4o mini durch OpenAI schließt sich ein Kapitel. Einige KIs sind veraltet, obwohl sie erst kürzlich veröffentlicht wurden. Dieses neue Modell wird das weit verbreitete und kostenlose ChatGPT 3.5 ersetzen. GPT-4o mini, das effizienter und stromsparender als das alte Modell ist, soll viel intelligenter sein als sein Vorgänger. Beim Übergang vom gewohnten Modell zu GPT-4o mini können Benutzer neue Funktionen erwarten und GPT-4o mini ist völlig kostenlos.
Um die Bedeutung dieser Änderung vollständig zu verstehen, müssen wir uns die Entwicklung von ChatGPT 3.5 ansehen. ChatGPT 3.5 wurde 2022 eingeführt und wurde schnell zu einem bekannten Namen. Es faszinierte die Benutzer mit seiner Fähigkeit, menschenähnliche Texte zu generieren, Fragen zu beantworten und bei verschiedenen Aufgaben zu helfen. Es wurde sowohl von Einzelpersonen als auch von Unternehmen weithin verwendet. Es diente sogar als leistungsstarkes Tool für die Erstellung von Inhalten, die Problemlösung und die allgemeine Informationsbeschaffung. In den letzten Jahren haben jedoch andere kostenlos veröffentlichte KIs ChatGPT 3.5 überholt.
Was kann der GPT-4o mini?
Der GPT-4o mini verfügt über eine Reihe von Verbesserungen, die ihn natürlich von seinem Vorgänger abheben, andernfalls wäre er unlogisch. Eine der bemerkenswertesten Verbesserungen ist die Möglichkeit, sowohl Text- als auch Bildverarbeitung durchzuführen. Diese neue duale Funktion ermöglicht es dem Modell, Informationen aus mehreren Quellen zu verarbeiten und zu verstehen, was möglicherweise zu umfassenderen und genaueren Ergebnissen führt.
Die Fähigkeiten des Modells wurden mit verschiedenen Benchmarks getestet. Beim MMLU-Benchmark (Massive Multitask Language Understanding), der das logische Denken in einem breiten Themenspektrum misst, erreichte der GPT-4o mini eine Punktzahl von 82 %. Diesen Ergebnissen zufolge übertrifft das neue Modell von OpenAI andere kleine KI-Modelle auf dem Markt. Wir werden Benchmarks in unserer eigenen Familie durchführen. Und natürlich liegt es an Ihnen.
Ein weiterer Bereich, in dem der GPT-4o mini glänzen soll, ist das mathematische Denken. Das Modell erreichte im MGSM-Benchmark (Mathematics Grade School Merge) beeindruckende 87 %. Das bedeutet, dass unser neuer Freund schönen Code schreiben, Logikprobleme lösen oder Ihnen bei komplexen Hausaufgaben helfen kann.
Was praktische Anwendungen angeht, unterstützt GPT-4o mini in seiner API sowohl Text als auch Bilder. Das bedeutet, dass Sie die Anwendung in andere Medien integrieren können, anstatt sie nur auf einer Website zu verwenden. OpenAI hört hier auch nicht auf und kündigt Pläne an, die Fähigkeiten des Modells in Zukunft um die Video- und Audioverarbeitung zu erweitern und so seine potenziellen Anwendungsfälle weiter auszuweiten.
Die GPT-4o Mini-Spezifikationen
Aus technischer Sicht versucht der GPT-4o mini, ein Gleichgewicht zwischen Leistung und Effizienz darzustellen. OpenAI hat die genaue Größe des Modells nicht bekannt gegeben, sagt aber, dass es auf Augenhöhe mit anderen kleinen KI-Modellen wie Llama 3 8b, Claude Haiku und Gemini 1.5 Flash steht. Ich meine, was sollte es sonst sein?
Einer der wichtigsten Vorteile des GPT-4o mini ist seine Geschwindigkeit. Wie Sie wissen, dauerten Antworten beim ChatGPT 3.5-Modell manchmal bis zu 20 Sekunden, jetzt dauern sie bis zu 10 Sekunden. Laut ersten Tests hat das Modell eine mittlere Durchsatzrate von 202 Münzen pro Sekunde. Dies ist mehr als doppelt so schnell wie beim GPT-4o und GPT-3.5 Turbo und eignet sich daher besonders für Anwendungen, bei denen schnelle Reaktionszeiten entscheidend sind.
Ein weiteres wichtiges technisches Merkmal des Modells ist das Kontextfenster. Der GPT-4o mini kann bis zu 128.000 Münzen gleichzeitig verarbeiten. Dies entspricht der Länge eines durchschnittlichen Buches. Dieses große Kontextfenster ermöglicht es dem Modell, Konsistenz und Relevanz bei langen Interaktionen oder beim Umgang mit langen Dokumenten aufrechtzuerhalten.
Der GPT-4o mini enthält Informationen und Daten bis Oktober 2023. Diese Daten können mit Updates aktualisiert werden. Aber für ein Ereignis oder eine Entwicklung nach diesem Datum erhalten Sie möglicherweise vorerst keine effizienten Antworten.
Ist es zu lang?
- Unterstützt Text- und Bildverarbeitung
- MMLU-Benchmark-Ergebnis: 82 %
- MGSM-Benchmark-Ergebnis: 87 %
- API unterstützt Text- und Bildeingabe
- Größe vergleichbar mit anderen kleinen KI-Modellen (Llama 3 8b, Claude Haiku, Gemini 1.5 Flash)
- Mittlere Ausgabegeschwindigkeit: 202 Token pro Sekunde
- Kontextfenster: 128.000 Token
- Wissensschluss: Oktober 2023
- Reaktionszeit bis zu 10 Sekunden
Wie wäre es mit dem Preis des GPT-4o Mini?
API-Preise wurden noch nicht bekannt gegeben, aber OpenAI hat das Modell zu einem Preis von 15 Cent pro Million Eingabetoken und 60 Cent pro Million Ausgabetoken für Entwickler, die seine APIs verwenden. Diese Preisstruktur macht GPT-4o mini erschwinglicher als seine Vorgänger und OpenAI behauptet, es sei 60 % günstiger als GPT-3.5 Turbo.
Die geringeren Kosten für den Betrieb von GPT-4o mini könnten weitreichende Auswirkungen auf die Zugänglichkeit von KI haben. Indem OpenAI erweiterte KI-Funktionen zu einem niedrigeren Preis verfügbar macht, öffnet es möglicherweise die Tür für eine breitere Einführung von KI-Technologie in einer Vielzahl von Branchen und Regionen.
Die Effizienz und Erschwinglichkeit des Modells machen es besonders attraktiv für umfangreiche, einfache Aufgaben, die wiederholte Aufrufe des KI-Modells erfordern. Dies könnte insbesondere für kleine und mittlere Unternehmen oder Entwickler von Vorteil sein, die an Projekten mit begrenztem Budget arbeiten.
GPT-4o mini im Vergleich zu anderen führenden Modellen
Um das neue Modell besser zu verstehen, machen wir einen technischen Vergleich mit anderen Modellen:
Modell | Genauigkeit (%) | MMLU | GPQA | FALLEN | MGSM | MATHEMATIK | Menschliche Eval | MMMU | MathVista |
GPT-4o mini | 82,0 | 40,2 | 79,7 | 87,0 | 70,2 | 87,2 | 59,4 | 56,7 | 63,8 |
Gemini-Blitz | 77,9 | 38,6 | 78,4 | 75,5 | 40,9 | 71,5 | 56.1 | 58,4 | 0,0 |
Claude Haiku | 73,8 | 35,7 | 78,4 | 71,7 | 40,9 | 75,9 | 50,2 | 46,4 | 0,0 |
GPT-3.5 Turbo | 69,8 | 30,8 | 70,2 | 56,3 | 43.1 | 68,0 | 0,0 | 0,0 | 0,0 |
GPT-4o | 88,7 | 53,6 | 83,4 | 90,5 | 76,6 | 90,2 | 69.1 | 0,0 | 0,0 |
GPT-4 | 90,0 | 55,0 | 85,0 | 92,0 | 78,0 | 92,5 | 70,5 | 60,0 | 65,0 |
GPT-4 Turbo | 91,0 | 56,0 | 86,0 | 93,0 | 79,0 | 93,5 | 71,0 | 61,0 | 66,0 |
Zwillinge | 85,0 | 50,0 | 80,0 | 88,0 | 72,0 | 88,5 | 65,0 | 55,0 | 60,0 |
Gemini Advanced | 87,0 | 52,0 | 82,0 | 90,0 | 74,0 | 90,0 | 67,0 | 57,0 | 62,0 |
- MMLU (Massive Multitask Language Understanding): Ein umfassender Benchmark zur Bewertung von Sprachmodellen für ein breites Aufgabenspektrum in verschiedenen Domänen.
- GPQA (Beantwortung allgemeiner Fragen): Ein Benchmark zum Testen der Fähigkeit eines Modells, Allgemeinwissensfragen genau zu beantworten.
- DROP (Diskretes Denken über Absätze): Ein Benchmark für das Leseverständnis, der von Modellen erfordert, diskrete Operationen wie Addition und Subtraktion über Text auszuführen.
- MGSM (Mehrstufige Mathematik): Ein Benchmark zur Beurteilung der Fähigkeit eines Modells, mehrstufige mathematische Probleme zu lösen.
- MATHEMATIK: Ein Benchmark, der sich speziell auf die Bewertung der Fähigkeiten von Sprachmodellen zur mathematischen Problemlösung konzentriert.
- Menschliche Bewertung: Ein Benchmark zur Beurteilung der Codegenerierung, bei dem Modelle anhand ihrer Fähigkeit bewertet werden, aus Problemstellungen korrekten und funktionsfähigen Code zu generieren.
- MMMU (Multimodales Maschinenverständnis): Ein Benchmark, der die Fähigkeit eines Modells testet, Informationen aus mehreren Modalitäten wie Text, Bildern und Audio zu verstehen und zu integrieren.
- MathVista: Ein spezieller Benchmark zur Bewertung der mathematischen Denk- und Problemlösungsfähigkeiten von Sprachmodellen in verschiedenen mathematischen Disziplinen.
Letztendlich hängt das „beste“ Modell von Ihren Anforderungen ab. Der GPT-4o mini bietet einen beeindruckenden Funktionsmix in einem kompakteren Paket und ist daher für viele Benutzer eine attraktive Wahl.
Bildnachweis: OpenAI
Source: ChatGPT 3.5 wird durch GPT-4o mini ersetzt