Microsoft hat „MAI-Transcribe-1“ auf den Markt gebracht, ein KI-Transkriptionsmodell, das eine Sprach-zu-Text-Genauigkeit in 25 weit verbreiteten Sprachen erreicht. Das Modell zielt darauf ab, Anwendungen wie Besprechungen, Untertitel und Diktate zu unterstützen.
MAI-Transcribe-1 wird zusammen mit den anderen Modellen MAI-Voice-1 und MAI-Image-2 auf Microsoft Foundry verfügbar sein. Microsoft gab an, dass diese Einführung es ermöglicht, „MAI-Modelle zum ersten Mal allgemein für die kommerzielle Nutzung verfügbar zu machen“, sodass Kunden Anwendungen evaluieren und erstellen können, die KI bei der Transkription, Sprach- und Bilderzeugung nutzen.
MAI-Voice-1 verfügt über eine hyperrealistische Sprachgenerierung, die die Identität des Sprechers und die emotionalen Nuancen über erweiterte Inhalte hinweg beibehält. Es verfügt über eine Sprachansagenfunktion, mit der aus nur einer Minute aufgezeichnetem Audio individuelle Markenstimmen entwickelt werden können.
Mittlerweile ist MAI-Image-2 ein neues Text-zu-Bild-Generierungsmodell, das sich durch die Wiedergabe von natürlichem Licht, präzisen Hauttönen und klarem Text in Bildern auszeichnet. Dieses Modell gehört zu den ersten drei auf der Text-zu-Bild-Bestenliste von Arena.ai.
Microsoft reduziert weiterhin seine Abhängigkeit von der OpenAI-Technologie. Das Unternehmen kritisiert GPT-4 wegen der hohen Kosten und langsamen Reaktionszeiten. Aus diesem Grund hat Microsoft mit der Entwicklung eigener KI-Modelle begonnen und prüft derzeit Modelle von Drittanbietern für seine Copilot-Funktion.
Mustafa Suleyman, KI-CEO von Microsoft, bestätigte den Fokus auf die Entwicklung „off-frontier“ KI-Modelle und stellte fest, dass diese nicht die Ausgereiftheit der OpenAI-Angebote erreichen werden. Die jüngste Umstrukturierung der Copilot-Führung von Microsoft führte zur Bildung von vier Abteilungen: Copilot-Erfahrung, Copilot-Plattform, Microsoft 365-Apps und KI-Modelle. Jacob Andreou, ein ehemaliger Snap-Manager, wird die Copilot Experiences-Abteilung leiten und an Microsoft-CEO Satya Nadella berichten.
Marc Benioff, CEO von Salesforce, erklärte zuvor, dass Microsoft die Verwendung der OpenAI-Technologie wahrscheinlich einstellen werde, und verwies auf die Herausforderungen, mit denen OpenAI konfrontiert sei, einschließlich der Aufgabe seines 500-Milliarden-Dollar-Stargate-Projekts, das auf den Bau von Rechenzentren in den USA abzielte.








