Die DALL-E-API-Integration wird jetzt von OpenAI angekündigt. Entwickler können DALL-E über diese neue API direkt in ihren Apps nutzen.
Der DALL-E-API-Zugriff befindet sich jetzt in der öffentlichen Beta
Wie Sie vielleicht bereits wissen, wurde der Zugriff auf DALL-E 2 in letzter Zeit für alle verfügbar gemacht! Mit dieser neuen Ankündigung werden GPT-3, Embeddings und Codex nun durch DALL-E ergänzt, ein Transformer-Sprachmodell, das es Benutzern ermöglicht, Eingabeaufforderungen in natürlicher Sprache zu verwenden, um Originalbilder zu generieren und zu ändern.
„Mehr als 3 Millionen Menschen nutzen bereits DALL·E, um ihre Kreativität zu erweitern und ihre Arbeitsabläufe zu beschleunigen, indem sie täglich über 4 Millionen Bilder erzeugen. Entwickler können innerhalb weniger Minuten mit der Entwicklung derselben Technologie beginnen“, angegeben OpenAI.
Sie teilten diesen Code und das Ausgabebild als Beispiel:
- Die Ausgabe:
Welche DALL-E API bietet Entwicklern?
Aufgrund der Vielseitigkeit von DALL-E können Benutzer einzigartige Bilder erstellen und verändern, die von kreativ bis fotorealistisch reichen. DALL-E ist hervorragend darin, Anweisungen in natürlicher Sprache auszuführen, sodass Benutzer genau angeben können, was sie sehen möchten. Während die Forschung von OpenAI voranschreitet, werden sie die API ständig aktualisieren, um die neuesten Entwicklungen in Bezug auf Bildqualität, Latenz, Skalierbarkeit und Benutzerfreundlichkeit widerzuspiegeln.
Eingebaute Moderation
Entwickler können ihre Anwendungen getrost ausliefern, da sie wissen, dass integrierte Gegenmaßnahmen – wie Filter für Hasssymbole und Gore – die schwierigen Aspekte der Moderation bewältigen werden, indem sie die Vertrauens- und Sicherheitslektionen einbeziehen, die wir beim Verteilen von DALL-E an 3 Millionen Künstler und gewonnen haben Benutzer weltweit. Als Teil unseres Engagements für eine verantwortungsvolle Bereitstellung bei OpenAI werden wir Vertrauen und Sicherheit weiterhin an erste Stelle setzen, damit sich Entwickler auf das Erstellen konzentrieren können.
DALL-E-Apps
OpenAI arbeitete eng mit einer ausgewählten Gruppe von Early Adopters zusammen, die DALL-E bereits in eine Reihe von Apps und Produkten integriert haben.
Microsoft integriert die DALL-E-API in Designer, ein brandneues Grafikdesign-Tool, mit dem Benutzer Einladungen, Bilder, digitale Postkarten, Social-Media-Posts und vieles mehr professionell erstellen können.
Darüber hinaus integriert Microsoft die DALL-E-API mit Image Creator in Bing und Microsoft Edge, sodass Benutzer Bilder erstellen können, falls Webergebnisse nicht das liefern, wonach sie suchen.
Das erste Mode- und Lifestyle-Betriebssystem der Welt heißt CALA. Von der Produktkonzeption bis hin zur E-Commerce-Ermöglichung und Auftragsabwicklung vereint CALA den gesamten Designprozess auf einer einzigen digitalen Plattform. Benutzer können frische Designkonzepte aus eingereichten Referenzfotos oder natürlich vorkommenden Sprachbeschreibungen erstellen, indem sie die neuen künstlichen Intelligenztechnologien von CALA verwenden, die von der DALL-E-API unterstützt werden.
Ein schnell wachsendes Foto-Startup namens Mixtiles verwendet ebenfalls die DALL-E-API. Dank Software und einem einfachen Aufhängungsprozess können Millionen von Menschen mit ihrer Hilfe atemberaubende Fotowände erstellen. Indem Menschen durch einen kreativen Prozess geführt werden, der frühe Erinnerungen, Fantasieorte und mehr einfängt, verwendet Mixtiles die DALL-E-API, um emotional ansprechende Kunstwerke zu erstellen und zu gestalten.
„Wir sind gespannt, was unsere Kunden mit DALL·E machen werden und auf welche kreativen Ideen sie kommen werden“, so OpenAI in der Mitteilung.
DALL-E-API-Preise
Die Größe des Ausgabebildes bestimmt den Preis für die DALL-E API. Während es winzige Rabatte für 512 x 512 für 0,018 $/Bild und 256 x 256 für 0,016 $/Bild gibt, kostet 1024 x 1024 0,02 $/Bild.
Luke Miller, Produktmanager bei OpenAI, erzählt VentureBeat dass die API drei Funktionen hat. Benutzer können ein Bild erstellen, einen Teil ändern und zahlreiche Versionen desselben Bildes erstellen.
„Man kann es sich ähnlich vorstellen wie den kreativen Prozess, Ideen zu entwickeln, etwas auszuwählen und einzugrenzen und dann weiter zu iterieren und etwas zu finden, das zu Ihren Bedürfnissen und dem gegebenen Kontext passt“, sagte er.
Laut Rowan Curran, einem KI- und ML-Experten bei Forrester Research, wird es für Entwickler „enorm nützlich“, wenn die DALL-E-API die Bildbearbeitung und -verbesserung ermöglicht.
In der Vergangenheit erwähnte Curran die Kosten, die mit der Pflege großer Sprachmodelle verbunden sind, als eine ihrer allgemeinen Einschränkungen. Daher sagte er, dass die DALL-E-API „eine ganze Reihe von Anwendungsfällen eröffnen würde, insbesondere für Startups und Leute, die Startkapital erhalten“.
DALL-E API-Dokumentation
Entwickler können die gesamte Dokumentation zur Erläuterung der DALL-E-API lesen über diesen Link. Als DALL-E 2 Outpainting einführte, waren wir wirklich aufgeregt. Wir freuen uns darauf, die Auswirkungen dieses neuen Sprungs von OpenAI zu sehen.
Source: Die öffentliche Betaversion der DALL-E API wird jetzt von OpenAI angekündigt