Googles DeepMind hat angekündigt Genie 2, ein bahnbrechendes Modell, das allein aus Texteingaben spielbare 3D-Spielwelten generieren kann. Diese Technologie baut auf der früheren Version Genie 1 auf, die 2D-Umgebungen erstellte. Die Weiterentwicklungen von Genie 2 machen es zu einem innovativen Werkzeug zur Schaffung vielfältiger, interaktiver Erlebnisse in Echtzeit.
Googles DeepMind stellt Genie 2 für 3D-Spielwelten vor
Genie 2 wurde entwickelt, um durch die Simulation von Animationen, Physik und Interaktionen immersive virtuelle Welten zu erschaffen. Durch die Verwendung von Bildern, die aus einfachen Textaufforderungen generiert werden können, ermöglicht das Modell kreative Flexibilität. Beispielsweise könnte ein Benutzer eine Anfrage für „einen Cyberpunk-Western“ eingeben und Genie 2 erstellt eine entsprechende Umgebung. Dieser innovative Ansatz nutzt generative KI, um die Grenzen dessen, was in virtuellen Räumen geschaffen werden kann, zu erweitern.
Das Modell arbeitet nach einem zweistufigen Prozess. Dazu ist zunächst ein Referenzbild erforderlich, das auch aus Text generiert werden kann. Sobald Genie 2 mit visuellen Eingaben versorgt wird, baut er daraus eine vollständige interaktive Welt auf. Demonstrationen zeigten nahtlose Spielerinteraktionen mithilfe traditioneller Steuerelemente wie dem WASD-Layout und sorgten so für eine intuitive Navigation.
Trotz dieser Fortschritte steht Genie 2 vor großen Herausforderungen. Insbesondere nimmt die Konsistenz des Modells nach etwa 20 Sekunden ab, wobei die längsten Simulationen bis zu einer Minute dauern. Diese Inkonsistenz kann auf ihre Fähigkeit zurückzuführen sein, „Kontrafakten“ zu erzeugen, was bedeutet, dass die KI verschiedene potenzielle Aktionen der Spieler berücksichtigt, was die Aufrechterhaltung einer kohärenten Erzählung erschwert.
Genie 2 glänzt durch seine Fähigkeit, verschiedene Perspektiven zu berücksichtigen, beispielsweise die Ego-Perspektive oder isometrische Ansichten. Es enthält auch Elemente wie realistische Wassereffekte und Umweltinteraktionen, veranschaulicht durch eine Demonstration, bei der eine Figur mit einem Ballon interagiert und dabei Physik, Schwerkraft und andere Dynamiken demonstriert. Einzelheiten zur Rendering-Auflösung und zur Anzahl der Polygone werden von Google jedoch nicht bekannt gegeben.
Die Fähigkeiten von Genie 2 gehen über das benutzergesteuerte Spielen hinaus. Das Modell kann auch KI-Charaktere effektiv simulieren, die innerhalb der generierten Umgebungen interagieren. Google veranschaulichte dies, indem es die Fähigkeit der KI zeigte, Befehle basierend auf Textaufforderungen innerhalb der generierten Welt auszuführen. Solche Merkmale deuten auf das Potenzial KI-gesteuerter NPCs hin, die in zukünftigen Spieleanwendungen realistisches Verhalten zeigen können.
Hinsichtlich der Trainingsdaten für Genie 2 ergeben sich Sicherheits- und ethische Bedenken. Es wurde vermutet, dass der Trainingsrahmen des Modells Gameplay-Videos von Plattformen wie YouTube umfassen könnte, was Bedenken hinsichtlich des geistigen Eigentums hinsichtlich der Ähnlichkeit mit urheberrechtlich geschütztem Material aufkommen lässt. Diese Probleme können zu Untersuchungen über die rechtlichen Auswirkungen der Nutzung vorhandener Inhalte durch generative KI führen.
Während die aktuellen Implementierungen von Genie 2 aufgrund ihrer Zeitlichkeit möglicherweise kein völlig kohärentes Spielerlebnis bieten, sieht DeepMind das Modell eher als Ressource für Forschung und Entwicklung als als vollwertige Spieleprodukte. Der Schwerpunkt liegt auf dem Prototyping interaktiver Erlebnisse und der Evaluierung von KI-Agenten in simulierten Umgebungen.
Die Einzelheiten der öffentlichen Veröffentlichung von Genie 2, der kommerziellen Anwendungen und der erforderlichen technologischen Ressourcen bleiben unklar, während Google sich langsam in diesen Gewässern zurechtfindet.
Ausgewählte Bild- und Videonachweise: Google DeepMind
Der Beitrag Googles DeepMind enthüllt Genie 2 für 3D-Spielwelten erschien zuerst auf TechBriefly.
Source: Googles DeepMind stellt Genie 2 für 3D-Spielwelten vor