Das traditionelle Internet ist für die menschliche Interaktion konzipiert und basiert auf visuellen Hinweisen und manueller Navigation. Da jedoch KI-Agenten zur primären Art und Weise werden, wie Benutzer mit der digitalen Welt interagieren, hat Google WebMCP eingeführt, um diese Lücke zu schließen. WebMCP wurde kürzlich in Chrome 146 Canary eingeführt und ist ein spezielles Protokoll, das es Websites ermöglicht, direkt mit KI-Assistenten über strukturierte Daten statt über visuelles Rendering zu kommunizieren. Dieser Wandel bewegt das Web von einem „Click-and-Scroll“-Modell zu einer „Action-on-Demand“-Infrastruktur.
Was ist WebMCP?
WebMCP oder das Web Model Context Protocol ist ein in den Browser integrierter Standard, der es einer Website ermöglicht, ihre Fähigkeiten als “Tool-Vertrag” zu bewerben. Anstatt dass ein KI-Agent Tausende von Token durchbrennt, um einen Screenshot zu verarbeiten, kann er jetzt eine bestimmte Funktion aufrufen – wie bookFlight oder addToCart – direkt über den Browser.
Die Navigator-API: Sie verwendet eine neue
navigator.modelContext-Schnittstelle, um eine nahtlose Kommunikation zu ermöglichen.Leistungssteigerungen: Durch die Umgehung der visuellen Interpretation verzeichnen Agenten einen Rückgang des Rechenaufwands um 67 %.
Unterstützung durch die Industrie: Während Google die Entwicklung leitete, war Microsoft Mitautor der Spezifikation, was auf zukünftige Unterstützung für Edge hinweist.
Das Problem mit aktuellen KI-Agenten
Bisher mussten KI-Agenten Websites „Reverse Engineering“ durchführen. Sie verwendeten entweder Vision-Modelle, um sich Bilder der Website anzusehen, oder „scraptierten“ den HTML-Code, um zu erraten, wo sich Schaltflächen befanden. Beide Methoden sind langsam, teuer und anfällig; Eine kleine Aktualisierung des CSS einer Website könnte eine komplette Automatisierung zum Scheitern bringen. WebMCP löst dieses Problem, indem es eine maschinenlesbare Karte dessen bereitstellt, was eine Website tatsächlich tun kann, wodurch Interaktionen schneller und weitaus zuverlässiger werden.
Implementierung für Entwickler
Das Protokoll bietet zwei unterschiedliche Möglichkeiten für Websites, „agentenbereit“ zu werden:
Deklarative API: Entwickler fügen Metadaten-Tags zu vorhandenen HTML-Formularen hinzu, sodass einfache Aktionen wie E-Mail-Anmeldungen leicht erkennbar sind.
Imperative API: Dies ermöglicht JavaScript-basierter Logik die Bewältigung komplexer, mehrstufiger Aufgaben wie der Konfiguration eines benutzerdefinierten Produkts oder der Navigation durch eine komplexe Kaufabwicklung.
Eine vielschichtige Vision für das Internet
WebMCP ist ein grundlegender Teil der umfassenderen Strategie von Google für eine Welt, in der KI die schwere Arbeit übernimmt:
Universelles Handelsprotokoll: Standardisiert Einkaufen, Entdecken und Support nach dem Kauf.
WebMCP: Fungiert als allgemeine Ebene für jede Art von Website-Interaktion.
Agent-zu-Agent-Protokoll: Entwickelt für vollständig autonome „Bot-to-Bot“-Aufgaben, während WebMCP sich auf das vom Menschen überwachte Surfen konzentriert.
Um zu verhindern, dass KI-Agenten ohne Aufsicht agieren, basiert WebMCP auf der Philosophie „permission-first“. Der Browser fungiert als Vermittler und stellt sicher, dass sensible Vorgänge – wie Zahlungen oder Datenaustausch – ein manuelles „Daumen hoch“ vom Benutzer erfordern. Dadurch wird sichergestellt, dass der Mensch der letztendliche Entscheidungsträger bleibt, während die KI die Arbeit erledigt.
Die Zukunft der digitalen Optimierung
Wir betreten die Ära von B2AI (Business-to-AI). In diesem Umfeld geht es bei technischem SEO nicht mehr nur um das Ranking in den Suchergebnissen; Es geht darum, wie einfach ein KI-Agent eine Transaktion auf Ihrer Website ausführen kann. Frühanwender von WebMCP werden wahrscheinlich mehr Traffic von KI-Assistenten erhalten, da diese Agenten von Natur aus zu Websites tendieren, die einfach, günstig und schnell zu navigieren sind.








