Meta AI: In diesem Beitrag erklären wir, was Lama 2 ist und wie man es verwendet. Meta stellte sein neuestes Llama 2 Large Language Model (LLM) vor, das in Tests andere Open-Source-Chat-Modelle (einschließlich GPT) in den meisten Benchmarks, einschließlich Nützlichkeit und Sicherheit, übertraf.
Neben der Veröffentlichung von drei alternativen Modellen im Rahmen der neuen Version – eines trainiert auf 7 Milliarden Parametern, eines auf 13 Milliarden und letztendlich eine 70-Milliarden-Version – stellt Meta AI auch „Llama 2 Chat“ zur Verfügung, eine verfeinerte Variante ausschließlich für Konversationsanwendungsfälle konzipiert.
Dies ist an sich schon eine technologische Errungenschaft, aber was noch faszinierender ist, ist, dass Meta und Microsoft auch eine Verstärkung ihrer Zusammenarbeit angekündigt haben, die es Entwicklern, die Microsoft-Tools verwenden, ermöglicht, bei der Erstellung von KI-Erlebnissen zwischen Metas Llama- und OpenAIs GPT-Modellen zu wählen.
Meta AI: Was ist Lama 2?
Die Transformatorarchitektur des autoregressiven Sprachmodells Llama 2 wurde optimiert. Die kommerzielle und akademische Nutzung von Llama 2 in englischer Sprache ist vorgesehen. Es gibt eine Vielzahl vorab trainierter und fein abgestimmter Varianten sowie Parametergrößen von 7 bis 70 Milliarden.
Laut Meta passen sich die optimierten Versionen durch Supervised Fine-Tuning (SFT) und Reinforcement Learning with Human Feedback (RLHF) an die menschlichen Präferenzen für Sicherheit und Hilfsbereitschaft an. Für das Vortraining von Llama 2 wurden 2 Billionen Token an Daten aus öffentlich zugänglichen Quellen verwendet.
Während vorab trainierte Modelle für eine Reihe von Aufgaben zur Generierung natürlicher Sprache modifiziert werden können, sind maßgeschneiderte Modelle für assistentenähnliche Konversationen konzipiert. Für welches Modell sich ein Entwickler auch entscheidet, die Anleitung zur verantwortungsvollen Nutzung von Meta AI kann dabei helfen, weitere Feinabstimmungen vorzunehmen, die möglicherweise erforderlich sind, um die Modelle mit den richtigen Sicherheitsminderungen anzupassen und zu optimieren.
Wie verwende ich Lama 2?
Es gibt hervorragende Neuigkeiten, wenn Sie Llama 2 von Meta AI selbst spielen möchten. Huggingface verfügt über eine leicht verfügbare Demoversion. Befolgen Sie einfach diese einfachen Schritte:
- Besuchen Sie diese Seite.
- Wenn Sie auf der Website ankommen, scrollen Sie nach unten, bis Sie einen Abschnitt mit der Bezeichnung „Demo“ sehen.
- Dort gibt es eine Chatbox. Geben Sie gleich eine Nachricht ein.
- Um Ihre Nachricht zu senden, drücken Sie die Eingabetaste.
Über SageMaker JumpStart in der SageMaker Studio-Benutzeroberfläche und dem SageMaker Python SDK können Sie auf die Grundmodelle zugreifen. In diesem Abschnitt besprechen wir die Suche nach Modellen in SageMaker Studio.
Eine integrierte Entwicklungsumgebung (IDE) namens SageMaker Studio bietet eine einzige webbasierte visuelle Schnittstelle, über die Sie auf Tools zugreifen können, die speziell für die Ausführung aller ML-Entwicklungsaufgaben erstellt wurden, von der Datenerfassung bis hin zum Erstellen, Testen und Bereitstellen Ihrer ML-Modelle. Beziehen auf Amazon SageMaker Studio Weitere Informationen zur Installation und Einrichtung von SageMaker Studio finden Sie hier.
Klicken Sie im SageMaker Studio auf „Vorgefertigte und automatisierte Lösungen“, um auf SageMaker JumpStart zuzugreifen, das vorab trainierte Modelle, Notebooks und vorgefertigte Lösungen enthält.
Sie können auf der SageMaker JumpStart-Landingpage nach Lösungen, Modellen, Notizbüchern und anderen Ressourcen suchen. Im Karussell Foundation Models: Text Generation stehen zwei prominente Llama 2-Modelle zur Auswahl. Aktualisieren Sie Ihre SageMaker Studio-Version, indem Sie sie anhalten und fortsetzen, wenn Sie keine Llama 2-Modelle sehen können. Weitere Einzelheiten zu Versionsaktualisierungen finden Sie unter Herunterfahren und Aktualisieren von Studio-Apps.
Wenn Sie „Alle Textgenerierungsmodelle erkunden“ auswählen oder „Lama“ in das Suchfeld eingeben, können Sie auch die verbleibenden vier Modellvarianten finden.
Um Informationen über das Modell, einschließlich seiner Lizenzierung, der verwendeten Trainingsdaten und Gebrauchsanweisungen, zu lesen, wählen Sie die Modellkarte aus. „Bereitstellen“ und „Notizbuch öffnen“ sind zwei weitere Schaltflächen, die Sie bei der Verwendung des Modells unterstützen.
Sie müssen die Endbenutzer-Lizenzvereinbarung und die Richtlinie zur akzeptablen Nutzung in einem Pop-up sehen, wenn Sie eine der Schaltflächen auswählen.
Nachdem Sie es bestätigt haben, gehen Sie zur nächsten Phase über, in der Sie das Modell verwenden.
Das folgende Beispiel zeigt, wie man Llama-Modelle mit wenigen Schüssen im Kontextlernen nutzt, indem man dem Modell Zugriff auf Trainingsdaten gewährt. Beachten Sie, dass wir nur Schlussfolgerungen aus dem eingesetzten Modell ziehen und dass die Modellgewichte durchgehend konstant bleiben.
Eingabe: Englisch ins Französische übersetzen:
Seeotter => Loutre de Mer
Pfefferminze => Menthe Poivrée
Plüschgiraffe => Giraffenpeluche
Käse =>Ausgang:
Herkunft
Schokolade => Schokolade
Auto => Auto
Hamster => Hamster
Bier => Bier
Fahrrad => Bicyclette
Banane => Banane
Erdbeere => Fraise
Pizza => Pizza
Cheeseburger => Cheeseburger
Ananas => Ananas
Karotte => Karotte
Wassermelone => pastèque
Wal => Baleine
Aubergine => Aubergine
Katze => Chat
Pinguin => Manchot
Löwe => Löwe
Elefant => Elefant
Panda => Panda
Tiger => Tiger
Lachs => Saumon
Eichhörnchen => écureuil
Känguru => Känguru
Schildkröte => Schildkröte
Oktopus => poulpe
Frosch => Grenouille
Schwein => cochon
Goldfisch => Rotgift
Tigerhai => Requin Tigre
Gorilla => Gorille
dol
Meta-KI
Die Verfügbarkeit von Llama 2 im Azure-KI Die Modellbibliothek wurde von enthüllt Microsoft auf seiner Microsoft Inspire-Konferenz. Jetzt können Programmierer es zum Erstellen verwenden. Darüber hinaus ist es für den lokalen Betrieb unter Windows konzipiert, um die Arbeitsabläufe für KI-Entwickler zu vereinfachen. AWSs Amazon SageMaker Jumpstart Hub bietet auch Llama 2 an, weitere Anbieter werden folgen.
Der Start einer offenes Ökosystem Es wurde auch eine Vereinbarung zwischen Microsoft und Meta AI für austauschbare KI-Frameworks bekannt gegeben. Der Open Neural Network Exchange (ONNX)-Standard für Deep-Learning-Modelle wurde erstmals 2017 von Meta AI (ehemals Facebook) angekündigt, und zu diesem Zeitpunkt begann die Entwicklung.
Die beiden versprachen, die Entwicklung offener KI zu fördern, insbesondere indem sie weltweit mehr Unternehmen Zugang zu grundlegender KI-Technologie gewähren.
Laut Meta AI wurden die Llama 2-Modelle einem Red-Teaming-Prozess unterzogen, bei dem die Mitarbeiter damit beauftragt wurden, Schwachstellen in der Sicherheitsarchitektur der Modelle zu identifizieren und deren Sicherheit zu gewährleisten. Darüber hinaus wurden externe Quellen genutzt, um „gegnerische Eingabeaufforderungen“ zu erstellen, die bei der Feinabstimmung des Modells helfen sollten.
Das Transparenzschema im Forschungsartikel Im Detail beschreibt Llama 2 die Nachteile des Modells und erläutert, wie Meta in Zukunft mit ihnen umgehen will. Benutzer von Llama 2 müssen sich an ein „akzeptable Verwendung”-Richtlinie, die es verbietet, das Modell zur Produktion schädlichen Codes zu verwenden, die unbefugte Weitergabe von Informationen oder Materialien an Minderjährige zu gestatten oder Inhalte zu produzieren, die Terrorismus fördern. Sie können auf die zugreifen vollständige Liste hier.
Um Programmierer zu ermutigen, das Sprachmodell zu übernehmen, „um schwierige Probleme zu lösen“, hat Meta das ins Leben gerufen Lama Impact Challengeweitere Informationen folgen.
Bevor Sie gehen, lesen Sie unseren Artikel: Die 15 besten Charakter-KI-Ideen, um Ihre Gespräche besser zu genießen
Hervorgehobener Bildnachweis: Unsplash.
Source: Meta AI: Was ist Lama 2 und wie wird es verwendet?