Laut einem Bericht der Financial Times hat Google den Zugriff von Meta auf seine Gemini-KI-Modelle aufgrund von Einschränkungen bei der Rechenkapazität eingeschränkt. Diese Einschränkung hat sich erheblich auf Meta ausgewirkt und das Unternehmen dazu gezwungen, seine Mitarbeiter anzuweisen, KI-Token effizienter zu nutzen. Meta verlagert außerdem Arbeitslasten von Gemini auf sein eigenes Muse-Spark-Modell, um seine Abhängigkeit von externen KI-Anbietern zu verringern.

Aufgrund der überlegenen Leistung im Vergleich zu den Open-Source-Modellen Llama von Meta war Meta zunächst bei Aufgaben wie Inhaltsmoderation und Sicherheitsprozessen auf Gemini angewiesen. Mit dem begrenzten Zugang zu Gemini beschleunigt Meta seinen Übergang zu Muse Spark, das es im Rahmen seiner Superintelligence Labs-Abteilung eingeführt hat. Die Anpassungen unterstreichen Metas Bemühungen, interne Alternativen für wesentliche Arbeitslasten zu entwickeln.

Als Reaktion auf die wachsende Nachfrage nach Gemini Enterprise hat Google SpaceX 920 Millionen US-Dollar pro Monat für den Zugriff auf 110.000 Nvidia-GPUs gezahlt, die als „Brückenkapazität“ bezeichnet werden. Diese Partnerschaft unterstreicht die Rechenknappheit, die die Beziehungen in der Technologiebranche verändert. Obwohl Google über eine beträchtliche Menge an KI-Infrastruktur verfügt und für 2023 Investitionsausgaben in Höhe von über 180 Milliarden US-Dollar prognostiziert, kann Google immer noch nicht alle Kundenanforderungen erfüllen und rationiert den Zugang zu seinen Modellen.

Meta hatte zuvor 8.000 Stellen abgebaut, um sich auf KI-Initiativen zu konzentrieren, und hat seitdem 7.000 Mitarbeiter auf Rollen mit Schwerpunkt auf künstlicher Intelligenz umverteilt. Die Beschränkungen für Gemini haben Meta dazu veranlasst, seine internen Fähigkeiten zu einem entscheidenden Zeitpunkt zu verbessern, da die Nachfrage nach KI-Rechnerressourcen die verfügbare Infrastruktur übersteigt. Andere Unternehmen wie Anthropic suchen in ähnlicher Weise nach Ressourcen von SpaceX, um ihre Geschäftstätigkeit zu unterstützen, was auf ein umfassenderes Problem der Lieferengpässe im KI-Sektor hinweist.

Die aktuelle Situation spiegelt einen erheblichen Engpass im KI-Boom wider, bei dem die Nachfrage nach Rechenleistung schneller wächst als die Infrastrukturentwicklung. Dieser Trend zeigt, dass die Einschränkungen, mit denen große Unternehmen beim Zugriff auf KI-Modelle konfrontiert sind, nicht nur auf algorithmische Herausforderungen zurückzuführen sind, sondern auch auf die physische Infrastruktur zurückzuführen sind, die zur Unterstützung des steigenden Verbrauchs erforderlich ist.


Quelle des hervorgehobenen Bildes