Llama 3.1 405b von Meta AI ist ein Hit, der viele Benutzer beeindruckt hat. Das neue Modell ist kein kleiner Fisch – es ist ein großer Fisch in einem ständig wachsenden Pool von Sprachmodellen. Werfen wir einen Blick auf die KI, die alle zum Sprechen und Schreiben bringt.
Llama 3.1 405b von Meta AI ist, wie der Name schon sagt, ein großes Sprachmodell mit 405 Milliarden Parametern. Es ist Teil der Llama 3-Reihe von Meta, die im April 2024 auf den Markt kommt. Erste Benchmarks deuten darauf hin, dass dieses Modell die aktuellen Spitzenreiter in mehreren wichtigen KI-Tests übertreffen könnte.
Ein Pferd ganz anderer Art: Die Spezifikationen des Llama 3.1 405b von Meta AI
Meta AI, früher bekannt als Facebook AI Research, ist die Forschungsabteilung für künstliche Intelligenz von Meta Platforms. Sie führten 2023 Llama (Large Language Model Meta AI) als Open-Source-Alternative zu proprietären Sprachmodellen ein. Llama gewann in der KI-Community schnell an Popularität. Aufbauend auf diesem Erfolg veröffentlichte Meta 2023 Llama 2, das deutliche Verbesserungen aufwies.
Mit Llama 3 hat Meta die Grenzen nun noch weiter verschoben und das leistungsstarke Modell Llama 3.1 405b entwickelt, das wir heute besprechen. Diese schnelle Weiterentwicklung zeigt Metas Engagement für die Weiterentwicklung der Open-Source-KI-Technologie.
In dieser Ära, in der künstliche Intelligenz überall um uns herum ist, machen Unternehmen nicht halt. In einer Zeit, in der wir alte Spielgrafiken betrachten und uns fragen, wie viel noch verbessert werden kann, haben wir gelernt, neue Grafiken zu verzeihen, und das Gleiche gilt für künstliche Intelligenz.
Meta AI ist in Sachen Leistung kein Faulpelz. Dieses Modell verfügt über 405 Milliarden Parameter und ist damit ein Schwergewicht im KI-Bereich. Was also bedeutet dieser 405b-Parameter?
Nachbar, sag nie: Meta AIs Llama 3.1 405b im Vergleich zur Konkurrenz
Meta-KI-Lama 3.1 405b zeigt beeindruckende Ergebnisse in frühen Benchmarks. Es übertrifft GPT-4 in mehreren Tests, darunter GSM8K, Hellaswag, Boolq und verschiedene MMLU-Kategorien. In Bereichen wie HumanEval und MMLU-Sozialwissenschaften hinkt es jedoch hinterher.
Die Leistung des Modells ist besonders bei Mathematik- und Codieraufgaben stark. Im GSM8K-Test erreichte beispielsweise Meta AIs Llama 3.1 405b 96,8 Punkte, während sein 70B-Gegenstück 94,8 Punkte erreichte. Im HumanEval erreichte das 405B-Modell 85,3 Punkte, verglichen mit 79,3 Punkten für die 70B-Version.
Diese Zahlen basieren auf dem Basismodell. Durch die Feinabstimmung der Anweisungen könnten diese Ergebnisse möglicherweise noch weiter verbessert werden. Wir können also sagen, dass diese Zahlen die Verarbeitungsleistung darstellen. Je höher die Zahl, desto besser (aber manchmal), aber manchmal brechen die Modelle unter ihrer Last zusammen.
Auf in die Zukunft: Llama 3.1 405b von Meta AI und Open-Source-KI
Die Tatsache, dass das Llama 3.1 405b-Modell von Meta AI eine Open-Source-KI ist und dass zum ersten Mal ein Open-Source-Modell das beste verfügbare Closed-Source-LLM in verschiedenen Benchmarks schlagen kann, könnte ein Zeichen für die Zukunft sein, auch wenn dies derzeit noch nicht vollständig verstanden wird. Im Moment können wir unsere GPTs in ChatGPT erstellen. Diese Abhängigkeit kann in Zukunft aufgehoben werden.
Meta AIs Llama 3.1 405b ist ein starker neuer Spieler im KI-Bereich. Seine starke Leistung bei verschiedenen Benchmarks und sein Open-Source-Charakter machen es zu einem Modell, das man im Auge behalten sollte. Da sich die KI weiterentwickelt, kann Meta AIs Llama 3.1 405b eine wichtige Rolle bei der Gestaltung der Zukunft von Sprachmodellen und KI-Technologie spielen.
Bildnachweis: Meta AI Blog
Source: Meta AIs Llama 3.1 405b erreicht Benchmarks