OpenAI hat während eines laufenden Gerichtsverfahrens wegen Urheberrechtsverletzungsklagen versehentlich wichtige Daten im Zusammenhang mit seiner Urheberrechtsklage mit der New York Times gelöscht. Der Vorfall betraf Daten von dedizierten virtuellen Maschinen, die den Klägern zur Verfügung gestellt wurden, was OpenAI in einer kürzlich eingereichten Akte gegenüber dem Gericht einräumte. Infolgedessen haben Anwälte der Times erklärt, dass sie eine Woche Arbeit im Zusammenhang mit dem Fall verloren hätten.
OpenAI muss im Rechtsstreit mit der New York Times einen Rückschlag wegen Datenverlust hinnehmen
Laut a Brief aus der TimesNach Angaben des Rechtsteams umfasste dieser Datenverlust „die Arbeit seiner Experten und Anwälte einer ganzen Woche“ und war „unwiederbringlich verloren“. Die Kläger untersuchten Behauptungen, dass die Modelle von OpenAI auf nicht autorisierte Inhalte trainiert worden seien. Im Rahmen dieses Prozesses sammelten sie in 150 Stunden intensiver Recherche Daten zu den Trainingsdatensätzen von OpenAI und suchten dabei insbesondere nach Fällen von Urheberrechtsverletzungen. Ein Bericht von TechCrunch gab an, dass die Löschung am 14. November erfolgte, als „Programme und Suchergebnisdaten, die auf einer der dedizierten virtuellen Maschinen gespeichert waren, von OpenAI-Ingenieuren gelöscht wurden“.
Der Kern der Klage behauptet dass OpenAI zusammen mit Microsoft – seinem Partner, der die Technologie von OpenAI für seinen Bing AI-Chatbot nutzt – das Urheberrecht der New York Times verletzt hat, indem es Paywall-Inhalte ohne Genehmigung verwendet hat. Die Times behauptet, dass die Modelle von OpenAI „nahezu wörtliche“ Nachbildungen ihrer Artikel erstellt hätten, was ihr Argument für Schadensersatz bildet. OpenAI hat diese Behauptungen konsequent zurückgewiesen und behauptet, dass seine Schulung auf öffentlich zugänglichen Daten beruhte, was gemäß den Urheberrechtsgesetzen als faire Nutzung zu qualifizieren sei.
Ein Sprecher von OpenAI kommentierte, dass es sich bei dem Vorfall um einen „Fehler“ handele. Gleichzeitig konnten sie die meisten gelöschten Daten erfolgreich wiederherstellen und kritische Elemente, einschließlich „der Ordnerstruktur und Dateinamen“, bleiben verloren und daher unbrauchbar. Daher stehen die Anwälte der Times nun vor der Herausforderung, ihre Beweissammlung von Grund auf neu zu starten. Trotz der Umstände gaben sie an, „keinen Grund zur Annahme“ zu haben [the erasure] „war beabsichtigt“, und betonte, dass OpenAI am besten positioniert sei, um seine Datensätze zu durchsuchen. Sie stellten jedoch auch fest, dass das Unternehmen nur zögerlich ist, Details zu seinen Trainingsdaten offenzulegen.
Erschwerend kommt hinzu, dass ähnliche Urheberrechtsansprüche gegen OpenAI erhoben wurden. Eine aktuelle Klage von Raw Story und AlterNet gegen das Unternehmen wurde abgewiesen, da die Kläger keine ausreichenden Beweise für einen mit ihren Anschuldigungen verbundenen Schaden vorlegen konnten. Im Gegensatz, Die New York Times hat Berichten zufolge über 1 Million US-Dollar an Anwaltskosten investiert, um seinen Fall gegen OpenAI zu verfolgen. Dieses finanzielle Engagement verdeutlicht die besondere Herausforderung kleinerer Verlage im Wettbewerb mit großen Technologieunternehmen.
OpenAI hingegen hat kürzlich Lizenzvereinbarungen mit mehreren großen Medienunternehmen abgeschlossen, die die Nutzung ihrer Inhalte zum Trainieren seiner KI-Modelle ermöglichen und dadurch Vergütung und Kredit gewähren. Berichten zufolge zahlt OpenAI dem Verlagsgiganten Dotdash Meredith jährlich mindestens 16 Millionen US-Dollar für Lizenzrechte, was seine Strategie widerspiegelt, formelle Partnerschaften statt laufender Rechtsstreitigkeiten anzustreben.
Bildnachweis: Furkan Demirkaya/Ideogramm
Der Beitrag „Das rechtliche Problem der NewYork Times verschärft sich, da OpenAI versehentlich wichtige Daten löscht“ erschien zuerst auf TechBriefly.