Reddit hat diese Woche eine große Änderung vorgenommen, um zu verhindern, dass Inhalte ohne Erlaubnis verwendet werden. Sie haben die sogenannte robots.txt-Datei aktualisiert, die Computerprogrammen (wie denen, die von Suchmaschinen verwendet werden) mitteilt, ob sie eine Website ansehen dürfen. Diese Datei war wichtig, damit Suchmaschinen Ihnen Websites anzeigen können, wenn Sie nach etwas suchen.
Doch jetzt, mit dem Aufkommen der künstlichen Intelligenz, verwenden einige Unternehmen Inhalte von Websites wie Reddit, um ihre KI-Systeme zu trainieren, ohne die ursprünglichen Ersteller zu fragen oder zu nennen. Dies ist zu einem großen Problem geworden, da es weder die Menschen respektiert, die die Inhalte erstellt haben, noch die Websites, die sie hosten.
Was macht Reddit?
Reddits Update der robots.txt-Datei zielt darauf ab, die Verwendung der Inhalte zu kontrollieren. Außerdem wird der Zugriff unbekannter Computerprogramme und Bots auf die Website eingeschränkt und blockiert, wenn diese die Regeln von Reddit nicht befolgen oder die Berechtigung zur Verwendung der Inhalte nicht haben.
Reddit sagt, dass diese Änderungen die meisten Menschen oder seriöse Organisationen wie Forscher oder Gruppen, die den Internetverlauf speichern (wie das Internetarchiv), nicht betreffen werden. Stattdessen versuchen sie, KI-Unternehmen davon abzuhalten, Reddit-Inhalte ohne Erlaubnis zu verwenden. Diese KI-Programme könnten jedoch weiterhin Reddits Regeln ignorieren.
Jüngste Untersuchungen und Reaktionen
Die Ankündigung folgte einem Bericht von Wired, in dem festgestellt wurde, dass ein KI-gestütztes Suchunternehmen namens Perplexity Inhalte von Websites entwendete, obwohl es in der robots.txt-Datei dazu aufgefordert wurde. Der CEO von Perplexity argumentierte, dass diese Regeln keine gesetzlichen Anforderungen seien, was eine Debatte darüber auslöste, wie Websites ihre Inhalte schützen können.
Die Reddit-Daten gehören vorerst Google
Die neuen Regeln von Reddit haben keine Auswirkungen auf Unternehmen, die bereits Vereinbarungen mit ihnen getroffen haben. So hat Reddit beispielsweise einen 60-Millionen-Dollar-Deal mit Google abgeschlossen, der es Google erlaubt, Reddits Daten für seine KI-Projekte zu verwenden. Dies zeigt, dass Reddit vorsichtig ist, wer seine Daten verwenden darf, und sicherstellen möchte, dass es sich um vertrauenswürdige Partner handelt.
„Jeder, der Reddit-Inhalte nutzt, muss unsere Regeln befolgen, um Reddit-Benutzer zu schützen“, sagte Reddit in einem Blogeintrag„Wir wählen sorgfältig aus, mit wem wir zusammenarbeiten und wem wir den Zugriff auf Reddit-Inhalte anvertrauen.“
Vorausschauen
Diese Änderung von Reddit ist Teil ihrer Bemühungen, die Verwendung ihrer Daten zu kontrollieren, insbesondere durch Unternehmen aus kommerziellen Gründen. Es zeigt einen wachsenden Trend unter Websites, ihre Inhalte im Zeitalter von KI und Big Data zu schützen.
Reddits Schritt sendet eine klare Botschaft: KI hat zwar großes Potenzial, aber es ist wirklich wichtig, die Herkunft der Daten zu respektieren und ihre Erlaubnis einzuholen. Da sich das Internet verändert, könnten Reddits Maßnahmen Einfluss darauf haben, wie andere Websites ihre Inhalte und die Rechte ihrer Benutzer schützen.
Alle Bilder werden erstellt von Eray Eliacık/Bing
Source: Reddit lässt Sie für seine Daten bezahlen