In den Vereinigten Staaten klagen zum ersten Mal Schriftsteller:innen und Creator gegen die Unternehmen OpenAI und Meta aufgrund von Urheberrechtsverletzungen. Sie werfen ihnen vor, dass sie ihre KI-Anwendungen mit Daten trainiert haben sollen, die ihnen nicht zustehen.
Das Wichtigste in Kürze
✅ Es kommt immer häufiger zu Klagen gegen OpenAI und andere Unternehmen aufgrund von Urheberrechtsverletzungen
✅ Einige Schriftsteller:innen werfen OpenAI nun vor, ChatGPT mit urheberrechtlich geschützten Werken “gefüttert” zu haben, ohne dazu berechtigt gewesen zu sein
✅ In zwei Sammelklagen wird bemängelt, dass ChatGPT mit Kommentaren von Social Media-Nutzer:innen trainiert worden sein soll, um dessen Kommunikationsfähigkeit zu verbessern
✅ OpenAI ist der Überzeugung, die Schriftsteller:innen hätten ein zu enges Verständnis vom Urheberrecht
OpenAI soll Daten genutzt haben, die dem Unternehmen nicht zustehen
Bereits im Juli 2023 warf die Schriftstellerin und Comedian Sarah Silverman dem Unternehmen OpenAI vor, dass es bei der Programmierung des KI-Tools ChatGPT Daten genutzt habe, die es nicht hätte verwenden dürfen.
Was ist ChatGPT?
ChatGPT ist ein Chatbot, der zur Gruppe der generativen Künstlichen Intelligenz gehört. In einem Chat kann das Tool souverän Antworten auf verschiedene Fragen geben. Darunter fallen auch Zusammenfassungen von Büchern, wissenschaftliche Erkenntnisse, die Erstellung von Reiseplänen und vieles mehr.
Um einen Chatbot wie ChatGPT zu trainieren, bedarf es riesiger Datenmengen. Diese werden in den Chatbot eingespeist, sodass er sich daraus die Antworten auf die gestellten Fragen ziehen kann.
Um möglichst korrekte Antworten zu produzieren, wurde ChatGPT mit Millionen von Werken wie Blogposts, Newsartikel oder anderen Informationsquellen gefüttert. Alles, was das Internet eben so hergibt. Die Folge ist, dass diese Werke zur Programmierung des Chatbots genutzt wurden, damit dieser die passenden Informationen hat, um auf die gestellten Fragen zu antworten. Chatbots gibt es auch von anderen Anbietern wie z. B. Facebook (Meta). Viele der genutzten Werke sind aber, wie das Buch von Sarah Silverman, urheberrechtlich geschützt.
Sarah Silverman ist der Ansicht, die Nutzung ihres urheberrechtlich geschützten Buches habe OpenAI nicht zugestanden. So habe sie keine finanzielle Entschädigung für die Verwendung ihres Buches bekommen. Silverman spricht in diesem Zusammenhang von Piraterie im Internet. Beweisen will die Schriftstellerin ihre Vorwürfe unter anderem damit, dass ChatGPT eine korrekte und detaillierte Zusammenfassung ihres Buches wiedergeben kann.
Rechtsstreitigkeiten mit OpenAI und Meta
Dem Beispiel von Silverman haben sich diverse Autor:innen, Schauspieler:innen und Creator angeschlossen. Sie alle werfen OpenAI und Meta vor, ihre Werke genutzt zu haben, ohne dass es ihnen gestattet war.
Für Aufsehen hatte in diesem Zusammenhang auch die Klage von George R.R. Martin gesorgt, der ähnliche Vorwürfe gegenüber OpenAI erhebt. Er und seine Kolleg:innen der amerikanischen Autorengewerkschaft sind der Ansicht, dass OpenAI die Werke im Rahmen der “Herr der Ringe”-Reihe urheberrechtswidrig genutzt hätten.
Zwei weitere Sammelklagen wurden in diesem Zusammenhang eingereicht. In diesen geht es um den Vorwurf, dass Kommentare von Nutzer:innen auf Social Media-Plattformen von OpenAI genutzt wurden, um auch damit ihr KI-Tool ChatGPT zu trainieren bzw. dessen Kommunikationsfähigkeit zu steigern.
Vor einigen Wochen hatte es Gerüchte gegeben, dass OpenAI sich in Verhandlungen mit der New York Times befinde. Diese sehe in ChatGPT eine Konkurrenz, die die von ihren Autor:innen verfassten Texte kostenlos verbreiten könnte. In diesem Zusammenhang änderte die New York Times auch ihre Nutzungsbedingungen dahingehend, dass die eigenen Inhalte nicht im Rahmen eines Large Language Modells (z. B. ChatGPT) genutzt werden dürfen.
Ob es diese Verhandlungen tatsächlich gab und wie sie ausgegangen sind, kann nicht verlässlich bestätigt werden. Zumindest aber zeigt sich ein Trend, in dem Künstler:innen sich gegen die (vermeintlich) rechtswidrige Verwendung ihrer Werke zur Wehr setzen.
Was hat Data Mining damit zutun?
Ob eine Urheberrechtsverletzung vorliegt, ist noch nicht geklärt. OpenAI äußerte gegenüber der Klage von Sarah Silvermann, dass diese das Urheberrecht zu eng verstehe. Man wolle versuchen, mit den Kläger:innen in konstruktive Gespräche über die Nutzung ihrer Werke einzusteigen.
Im deutschen Urheberrecht findet sich seit 2019 der § 44b UrhG. In dieser Regelung geht es um das sogenannte Data Mining. Danach liegt keine Urheberrechtsverletzung vor, wenn die benutzten Werke rechtmäßig zugänglich sind. Dies lag im vorliegenden Fall aber gerade nicht vor.
Was bedeutet Data Mining?
Unter Data-Mining versteht man die systematische Anwendung statistischer computergestützter Methoden auf große Datenbestände, um Muster, Zusammenhänge oder Trendentwicklungen zu finden. Das Erkennen von Mustern soll dabei helfen, Probleme leichter lösen zu können.
Zu beachten ist auch, dass das kalifornische Urheberrecht nicht mit den deutschen Regelungen identisch ist. Trotzdem dürften die Urteile der amerikanischen Gerichte auch für den deutschen bzw. europäischen Gesetzgeber wegweisend sein.
Untersuchungen auch von staatlicher Seite
Die amerikanische Federal Trade Comission (deutsch: Bundeshandelskommission) hat eine Untersuchung gegen OpenAI wegen des Verdachts weitgehender Datenschutzverstöße eingeleitet. Das Schreiben, das laut der Washington Post an OpenAI ging, enthält 49 Fragen. Laut dem Bericht hat die FTC Bedenken hinsichtlich der Art und Weise geäußert, wie OpenAI mit datenschutzrechtlichen Fragen und der Verbreitung von Falschinformationen umgeht. Infolgedessen könnten Regulierungen und Maßnahmen ergriffen werden, um die Verwendung von KI-Systemen wie ChatGPT zu kontrollieren und deren potenziell schädliche Auswirkungen einzuschränken.
Update: New York Times klagt gegen OpenAI und Meta
Was zunächst nur ein Gerücht war, hat sich nun bestätigt. OpenAI und die New York Times standen in Verhandlungen über den Umgang von OpenAI mit Texten der New York Times (NYT). Anscheinend sind diese Verhandlungen nicht ausreichend gewesen, sodass sich die NYT nun dazu veranlasst gesehen hat, eine Klage gegen OpenAI und Microsoft einzureichen.
In dieser geht es um die bereits besprochenen Vorwürfe. OpenAI soll in ihrem Chatbot dem LLM ChatGPT Texte des Nachrichtenmagazins verwendet haben, ohne dass es diese hätte nutzen dürfen. Dabei spricht die Zeitung von Millionen an Texten, die angeblich für die KI verwendet wurden.
Die Zeitung möchte nun Schadensersatz in Form von Geld. Eine genaue Summe wird dabei nicht genannt, der Schaden beziffere sich aber auf Milliarden von US-Dollar. Gleichzeitig sollen Chatbot-Modelle, die Texte der New York Times verarbeiten und nutzen, gleich abgeschaltet bzw. zerstört werden, so die Zeitung in einem Statement.
Mit anderen Medienhäusern scheint OpenAI besser arbeiten zu können. So wurde erst vor kurzem die Partnerschaft zwischen OpenAI und der Axel Springer SE bekanntgegeben.
Wie das Gericht in Manhattan darüber befinden wird, bleibt abzuwarten. Sicher ist aber, dass die juristische Auseinandersetzung mit dem Thema Künstliche Intelligenz und Urheberrecht gerade erst begonnen hat.