Ein neuer Lizenzstandard, Really Simple Licensing (RSL), wurde eingeführt, um Web-Publishern die Definition der Bedingungen zu ermöglichen, unter denen KI-Systementwickler ihre Inhalte nutzen können. Die Initiative zielt darauf ab, einen Rahmen für KI-Unternehmen zu schaffen, um Verlage dafür zu entschädigen, dass sie ihre Daten zum Trainieren von KI-Modellen verwenden.
Am Mittwoch gaben namhafte Organisationen wie Reddit, Yahoo, Medium, Quora und People Inc. ihre Unterstützung für den RSL-Standard bekannt, ein offenes Lizenzierungsprotokoll für Inhalte. Mit diesem Standard können Herausgeber festlegen, wie Bots dafür bezahlen sollen, ihre Websites nach KI-Trainingsdaten zu durchsuchen, mit dem Ziel, KI-Unternehmen gemeinsam zur Übernahme des Frameworks zu bewegen.
Der RSL-Standard erweitert das bestehende robots.txt-Protokoll, das es Publishern in der Vergangenheit ermöglicht hat, Webcrawlern mitzuteilen, auf welche Teile ihrer Website sie zugreifen können und auf welche nicht. RSL verbessert dies, indem es Websites ermöglicht, Lizenz- und Lizenzbedingungen in ihre robots.txt-Datei aufzunehmen. Diese Begriffe können auch in Online-Bücher, Videos und Schulungsdatensätze eingebettet werden, sodass Verlage eine Entschädigung für ihre Nutzung verlangen können.
Hinter dem RSL-Standard steht das RSL Collective, eine neu gegründete Rechteorganisation. Es wird von Eckart Walther, einem Mitentwickler des Really Simple Syndication (RSS)-Standards und ehemaligen CEO von CardSpring, und Doug Leeds, dem ehemaligen CEO von IAC Publishing und Ask.com, geleitet. Walther erklärte: „Ziel ist es, ein neues, skalierbares Geschäftsmodell für das Web zu schaffen. RSL übernimmt einige dieser frühen RSS-Ideen und schafft eine neue Ebene für das gesamte Internet, auf der Lizenzrechte und Vergütungsrechte definiert werden.“
Der RSL-Standard unterstützt verschiedene Lizenzmodelle, einschließlich kostenloser Optionen. Websitebesitzer können von KI-Unternehmen die Zahlung einer Abonnementgebühr oder einer Pay-per-Crawl-Gebühr über den RSL-Standard verlangen, die jedes Mal erhoben wird, wenn ein KI-Bot die Website crawlt. Darüber hinaus kann eine Pay-per-Inference-Gebühr eingeführt werden, die es Websites ermöglicht, eine Vergütung zu erhalten, wenn ein KI-Modell auf ihre Arbeit verweist, um eine Antwort zu generieren. Bots, die Websites zu anderen Zwecken crawlen, etwa zur Archivierung oder zur Einbindung in Suchmaschinen, können wie gewohnt weitermachen.
Mehrere Medienunternehmen, darunter Vox Media (Muttergesellschaft von The Verge), News Corp (Eigentümer des Wall Street Journal) und The New York Times, haben bereits Lizenzvereinbarungen mit einzelnen KI-Unternehmen wie OpenAI und Amazon abgeschlossen. Ziel des RSL Collective ist es, diesen Prozess zu rationalisieren, sodass jeder Websitebesitzer oder -ersteller eine Vergütung für seine Arbeit erhalten kann, ohne separate Verträge auszuhandeln.
Der Erfolg von RSL hängt von der Akzeptanz durch wichtige Branchenakteure, insbesondere KI-Unternehmen, ab. Entwickler von KI-Modellen werden beschuldigt, die robots.txt-Dateien von Websites missachtet zu haben, und es gibt derzeit keine einfache Methode, um Inferenzgebühren ohne ihre Mitarbeit zu verfolgen. Das RSL Collective setzt auf den gemeinsamen Einfluss großer Web-Publisher, um die Einführung des Standards attraktiver zu gestalten. Leeds erklärte: „Unsere Aufgabe ist es, rauszugehen und eine große Gruppe von Leuten dazu zu bringen, zu sagen, dass es in Ihrem Interesse ist, sowohl effizient, weil Sie mit jedem gleichzeitig verhandeln können, als auch auf legalem Wege, denn wenn Sie das nicht tun, verletzen Sie alle gleichzeitig.“
Im Gegensatz zu Systemen wie Cloudflares „Pay-per-Crawl“ kann der RSL-Standard allein Bots nicht daran hindern, eine Website zu besuchen. Das RSL Collective arbeitet mit Fastly, einem Content-Delivery-Netzwerk, zusammen, um den KI-Bot-Zugriff auf Websites basierend darauf zu kontrollieren, ob sie der Lizenzierung von Inhalten zugestimmt haben. Leeds beschrieb Fastly als „den Türsteher an der Tür zum Club, und sie lassen niemanden herein, wenn sie nicht über den richtigen Ausweis verfügen. RSL stellt die Ausweise aus. Also sagen wir: ‚Hey, Sie haben der Lizenzierung dieses Inhalts zugestimmt‘, und Fastly sagt: ‚Kommen Sie, geben Sie Ihren Ausweis ein.‘“
Leeds glaubt, dass das RSL Collective Lizenzen rechtlich durchsetzen kann, und erklärt, dass „alle Teilnehmer der kollektiven Rechteorganisation an der Durchsetzung etwaiger Verstöße beteiligt sind“, wodurch die Anwaltskosten verteilt werden. Er verglich dieses System mit bestehenden Organisationen für digitale Rechte, wie etwa der Musikrechtsgruppe ASCAP, die Lizenzgebühren erhebt und an ihre Mitglieder verteilt. Während die konventionelle Musiklizenzierung von starken rechtlichen Präzedenzfällen für den Urheberrechtsschutz profitiert, bleiben unbefugtes Scraping und die Verwendung von Medien zum Training von KI-Systemen in einer rechtlichen Grauzone. Große KI-Akteure sehen sich derzeit mit Klagen von Unternehmen wie Reddit, Getty Images und verschiedenen Online-Publishern konfrontiert.
Leeds und Walther erklärten: „Es stellte sich schon immer die Frage, ob Bots Bedingungen zugestimmt haben, die sie nicht sehen. RSL ändert das grundlegend und macht Crawler über die Bedingungen informiert, bevor sie auf eine Website zugreifen.“
Leeds hofft, dass das System eine intuitive Möglichkeit zur Lizenznavigation bietetsing arbeitet für die KI-Schulung und erklärt: „Was wir tun, ist nicht, Räder neu zu erfinden oder Räder zu erfinden – wir bringen sie nur an einen Ort, an dem sie vorher noch nicht existiert haben. Der Grund, warum sie hier noch nicht existiert haben, ist, dass sie keinen Standard hatten, auf dem wir aufbauen könnten. Deshalb ist der RSL-Standard so wichtig: Er bietet die Infrastruktur, um dann die Dinge zu schaffen, die in jeder anderen Medienbranche funktioniert haben, was noch nicht geschehen ist.“
Die Teilnahme am RSL Collective ist für Herausgeber und Ersteller kostenlos. Auch andere große Marken wie O’Reilly, wikiHow und Ziff Davis (Inhaber von IGN) sind der Organisation beigetreten.








