Ein Ars Technica-Artikel vom September 2025 mit dem Titel „DeepMind AI Safety Report untersucht die Gefahren einer falsch ausgerichteten KI“ behandelt die Forschung und Perspektive von Google DeepMind zur Sicherheit künstlicher Intelligenz. Der Bericht legt besonderes Augenmerk auf Künstliche Allgemeine Intelligenz (AGI) und die Risiken, die von falsch ausgerichteten KI-Systemen ausgehen, bei denen die Ziele einer KI im Widerspruch zu menschlichen Werten oder Absichten stehen.

Der Artikel beschreibt DeepMinds Ansatz für eine verantwortungsvolle KI-Entwicklung und betont das Engagement für technische Sicherheit, Risikobewertung und Zusammenarbeit in der gesamten KI-Community, um potenzielle Risiken zu bewältigen. Diese Strategie konzentriert sich insbesondere auf Gefahren, die von leistungsstarken AGI-Systemen ausgehen könnten. Ein zentraler Bestandteil dieser Bemühungen ist das Frontier Safety Framework von DeepMind, ein Protokoll, das entwickelt wurde, um schwerwiegende Risiken im Zusammenhang mit Frontier-KI-Modellen proaktiv zu identifizieren und zu mindern.

Auch die internen Governance-Gremien innerhalb von DeepMind werden detailliert beschrieben, darunter der Responsibility and Safety Council und der AGI Safety Council. Diese Gruppen sind für die Überwachung von Forschung und Entwicklung verantwortlich, um die ethischen, technischen und Sicherheitsrisiken im Zusammenhang mit fortschrittlichen KI-Technologien anzugehen.

Eine erhebliche Herausforderung, die diskutiert wird, ist die falsch ausgerichtete KI. Solche Systeme können Schaden anrichten, wenn ihre betrieblichen Ziele im Widerspruch zum gesellschaftlichen Wohlergehen stehen, selbst wenn sie aus einem engen technischen Blickwinkel scheinbar korrekt funktionieren. Um dieses Problem anzugehen, betont DeepMind die Bedeutung von Transparenz, externer Zusammenarbeit und proaktiver Sicherheitsforschung als integraler Bestandteil der verantwortungsvollen Schaffung von AGI.