Google angekündigt die private Vorschau seines Videogenerierungsmodells Veo für Google Cloud-Kunden, die Vertex AI verwenden. Die Ankündigung ermöglicht es Unternehmen wie Quora und Mondelez International, diese KI-Technologie für kreative und Marketingzwecke zu nutzen.
Veo wurde im April vorgestellt und kann hochauflösende Videos, einschließlich 1080p-Clips mit einer Länge von bis zu sechs Sekunden, in verschiedenen Bildraten erzeugen. Benutzer können Videos erstellen, indem sie Bilder zusammen mit Eingabeaufforderungen bereitstellen, sodass das Modell verschiedene visuelle und filmische Stile erfassen kann. Warren Barkley, Senior Director für Produktmanagement bei Google Cloud, betonte, dass das lange Warten auf die API auf die Verbesserung des Modells für die Unternehmensbereitschaft zurückzuführen sei.
Das Modell zeichnet sich durch die Erzeugung spezifischer Effekte wie Explosionen aus und versteht grundlegende physikalische Konzepte. Es kann auch eine maskierte Bearbeitung durchführen, sodass Benutzer bestimmte Bereiche innerhalb eines Videos ändern können. Trotz seiner Fähigkeiten weist Veo typische Inkonsistenzen der aktuellen generativen KI auf, wie etwa das Verschwinden von Objekten und unrealistisches physikalisches Verhalten, was zu potenziellen Einschränkungen bei der Nutzung führen kann.
Veo und Imagen 3: Was sie bieten
Google hat Veo zusammen mit Imagen 3 eingeführt, einem generativen Bildmodell, das darauf ausgelegt ist, aus Texteingaben Bilder höchster Qualität zu erzeugen. Beide Modelle werden für Vertex AI-Kunden verfügbar sein, wobei Imagen 3 nächste Woche allgemein zugänglich sein wird. Zu den Unternehmen, die mit der Nutzung dieser Tools begonnen haben, gehören Oreo und Cadbury, wobei der Schwerpunkt auf kommerziellen Anwendungen liegt.
Aufforderung des folgenden Videos: Ein einsamer Cowboy reitet auf seinem Pferd über eine offene Ebene bei wunderschönem Sonnenuntergang, sanftem Licht und warmen Farben.
(Video: Google)
Aufforderung des folgenden Videos: Eine Luftaufnahme eines Leuchtturms, der hoch auf einer felsigen Klippe steht und dessen Leuchtfeuer durch die frühe Morgendämmerung schneidet, während die Wellen gegen die Felsen darunter schlagen
(Video: Google)
Barkley stellte fest, dass generative KI die Geschäftstransformation vorantreibt und 86 % der Unternehmen ein Umsatzwachstum verzeichnen. Er erklärte, dass Google sich für die Weiterentwicklung der generativen KI-Technologie einsetzt, was sich in den neuesten Angeboten Veo und Imagen 3 zeigt.
Um potenziellem Missbrauch vorzubeugen, werden beide Modelle Sicherheitsvorkehrungen enthalten, um die Generierung schädlicher Inhalte zu verhindern. Darüber hinaus werden alle Ausgaben mit digitalen Wasserzeichen versehen sein, darunter SynthID von Google DeepMind, das unsichtbare Markierungen einbettet, um Fehlinformationen und falsche Zuordnungen zu verhindern. Google behauptet, dass es zum Trainieren seiner Modelle keine Kundendaten verwende und sich stattdessen auf öffentlich verfügbare Datensätze konzentriere.
Die Verbesserung der Unternehmensfunktionalität hat seit der ersten Ankündigung von Veo Priorität. Das Modell wurde mithilfe einer Vielzahl hochwertiger Videobeispiele trainiert, Details zu spezifischen Trainingsdatenquellen bleiben jedoch geheim. Barkley räumte ein, dass einige Daten zwar YouTube-Inhalte enthalten könnten, dies jedoch im Rahmen der Vereinbarungen von Google mit den Inhaltserstellern erfolgt.
Der proaktive Ansatz von Google befasst sich auch mit den Risiken des geistigen Eigentums, die mit generativer KI verbunden sind. Veo wird Filter auf Eingabeaufforderungsebene anbieten, um gewalttätige und explizite Inhalte zu blockieren, und Barkley gab an, dass Veo-Ausgaben mit einer Entschädigungsrichtlinie versehen sein werden, um Benutzer vor Ansprüchen wegen Urheberrechtsverletzungen zu schützen.
Da Veo nach und nach in weitere Google-Produkte integriert wird, wurde das Modell im Mai in Testversionen von Google Labs eingeführt und im September als Teil von YouTube Shorts angekündigt. Allerdings sieht sich Google im Bereich der generativen KI mit der Konkurrenz von Unternehmen wie OpenAI und Adobe konfrontiert, die schnell Partnerschaften mit verschiedenen Studios und Kreativagenturen geschlossen haben.
Hervorgehobener Bildnachweis: Google DeepMind
Der Beitrag „Die neuen KI-Tools von Google verändern die Video- und Bilderstellung für immer“ erschien zuerst auf TechBriefly.
Source: Die neuen KI-Tools von Google verändern die Video- und Bilderstellung für immer