Angriff auf das Urheberrecht

Wer die Entwicklung der generativen KI seit Ende 2022 konsequent verfolgt hat, wird erkennen, dass wir uns mitten in einem weltweit angelegten Angriff auf das Urheberrecht befinden. Für das Training der unterschiedlichen Generatoren benötigt es Unmengen an Daten in Bild, Text und Ton. Jeder der solche Inhalte erstellt, ist ein Urheber. Also auch du, der du gerade einen Facebook-Artikel schreibst, oder du, der du eine Nachricht in WhatsApp tippst oder darüber sogar eine Sprachnachricht versendest.

In den letzten Wochen gab es verschiedenste Meldungen, die diesen Angriff unverblümt in die Welt hinausposaunen und das scheint weit weniger Leute zu empören, als es eigentlich sollte. Da stellt sich mir halt die Frage: Ist euch das egal? Versteht ihr nicht, dass das auch euch betrifft? Oder denkt ihr schulterzuckend, das ist halt der Fortschritt und lasst jeden über die Klinge springen inkl. euch selbst?

Britische Regierung bezieht Stellung

Ein eindeutiges Zeichen pro Urheberrecht kam der Tage aus UK (United Kingdom). Es ist bislang das Einzige seiner Art. Alle anderen Regierungen konnten sich bislang noch nicht zu so einer Stellungnahme durchringen. Die britische Regierung hat festgehalten,

„dass die Verwendung von urheberrechtlich geschützten Werken als KI-Trainingsdaten gegen das Urheberrecht verstößt, sofern dies nicht durch eine Lizenz oder eine Ausnahmegenehmigung gestattet ist.“

https://www.pinsentmasons.com/out-law/news/ai-report-confirms-decision-on-protection-of-copyright-works?utm_source=linkedin.com&utm_medium=social&utm_campaign=PM_share

(das Zitat ist eine dt. Browserübersetzung)

Mit dieser Meldung hat UK sich gegen die Praktiken der KI-Firmen positioniert, die mit ihren KI-Crawlern das ganze Internet in Sekundenschnelle nach Inhalten für das KI-Training abgrasen, ohne um Erlaubnis zu fragen. In den USA berufen sich diese Unternehmen auf das Fair-Use-Verfahren, während in der EU das Text und DataMining als Bestandteil des Urheberrechtes die Erhebung von Trainingsdaten regelt. Und der Rest der Welt hat diesbezüglich auch keine nennenswerten Gesetze, die einen angemessenen Schutz darstellen würden. Es ist also der wilde Westen in Kombination mit der Goldgräberstimmung aus dem Klondike. Trainingsdaten sind das neue Gold.

OpenAI will Befreiung vom Urheberrecht

Mit der Meldung zu Beginn der zweiten Januarwoche 2024, freien Zugang zu urheberrechtlich geschützten Material haben zu wollen, verschaffte sich OpenAI gehör. Das Unternehmen gab zudem offen zu, ohne urheberrechtliches Material sei es unmöglich, generative KI weiterhin zu trainieren.

Außerdem heißt es:

„Die Beschränkung der Trainingsdaten auf gemeinfreie Bücher und Zeichnungen, die vor mehr als einem Jahrhundert erstellt wurden, könnte zu einem interessanten Experiment führen, würde aber keine KI-Systeme bereitstellen , die den Bedürfnissen der heutigen Bürger gerecht werden“, sagte das Unternehmen in den dem House of Lords vorgelegten Mitteilungen und Unterlagen Digitalausschuss.“

https://www.independent.co.uk/tech/openai-chatgpt-copyrighted-work-use-b2475386.html

(das Zitat ist eine dt. Browserübersetzung)

OpenAI’s Angriff auf das Urheberrecht versteckt sich also auch noch hinter den sog. Bedürfnissen der Allgemeinheit und spielt diese gegen die Urheber aus. Dabei befinden sich so viele Urheber in genau jener Gesellschaft, dessen Bedürfnisse befriedigt werden sollen. Schon verquer diese Denkweise, oder?

Mit dem unverblümten Auftreten von OpenAI ist nun offenkundig, dass die Klagen, die derzeit gegen das Unternehmen laufen, sehr viel mehr entscheiden. Die großen Autoren wie George R. R. Martin, die da gerade streiten, streiten für alle Urheber und nicht nur für sich selbst.  Diesem Kampf hat sich übrigens die New York Times inzwischen angeschlossen, nachdem Verhandlungen mit OpenAI über Lizenzvereinbarungen gescheitert sind. Die Klageschrift ist auch öffentlich einsehbar: hier.

Die graue Lady, wie die NYT auch genannt wird, gilt als Gamechanger, denn sie soll gemäß Medienberichten in unzähligen Fällen beweisen können, dass ChatGPT auch noch massenweise plagiiert, und zwar anhand des zu Trainingszwecken erhobenen Datenmaterials der NYT. Gelingt der NYT diese Beweisführung vor Gericht, ist damit offiziell bestätigt, dass es sich nicht nur bei ChatGPt um eine Plagiatssoftware handelt. Alle Text-Generatoren mit dem gleichen Trainingsdatensatz wären dann damit gelabelt.

Meta degradiert Schriftsteller und Autoren

Einen ähnlichen Angriff auf das Urheberrecht erfolgte vor kurzem auch seitens Meta durch den französischen Forscher „Yann Le Cun, der für Meta – die Muttergesellschaft von Facebook – arbeitet“. Sein Vorstoß ist spezieller und zielt auf die Autorenschaft bzw. Schriftsteller ab. Auch er bemängelt, dass es nicht ausreichend gemeinfreies Trainingsmaterial gibt. Für ihn sind Autoren bzw. Schriftsteller mit einem Verdienst unterhalb von 2000 US-Dollar monatlich ein kleiner Verlust. Diese Urheber sollten doch ihre Werke gemeinfrei stellen und damit der Gesellschaft einen guten Dienst erweisen.

Gemeinfreie Werke bedürfen immerhin niemandes Erlaubnis, um zu Trainingszwecken erhoben zu werden. Damit stößt Yann Le Cun in das gleiche Horn wie OpenAI zuvor. Allerdings ist sein Versuch, sich mit den Bedürfnissen der Gesellschaft zu schützen, gründlich misslungen. Ihm wehte nach seiner Äußerung ein scharfer Wind entgegen. Zu recht, wie ich finde. Das Einkommen von 2000 US-Dollar geradezu als überflüssig abzutun und damit auch noch die Urheber zu entwerten, zeugt schon von nicht gerade wenig Ignoranz. Umgerechnet entsprechen 2000 US-Dollar ungefähr 1841 €. Das entspricht einem Netto-Gehalt im niederen Bereich in Deutschland. So und nun lasst euch mal auf der Zunge zergehen, wie viele Menschen mit so einer Forderung gleichzeitig nicht nur das Urheberrecht aberkannt werden würde, sondern gleich die Existenzgrundlage.

Google greift nach Urhebern seiner Dienste

Der neueste noch in Vorbereitung befindliche Angriff auf das Urheberrecht stammt allerdings von Google höchst selbst. Das Unternehmen plant noch dieses Jahr (2024) ein KI-Upgrade seines Dienstes Google Messenger für Android-Smartphones.

Nach dem Upgrade soll der KI vollständiger und dauerhafter Zugriff auf private Nachrichten gewährt werden, um gemäß seiner Funktion als persönlicher KI-Assistent des Smartphone-Nutzers zu agieren. Der Assistent analysiert dann den Kontext der Gespräche, Tonfall und Interessen der Gesprächspartner. Ebenso wird der Nachrichtenverlauf der Kontakte analysiert, um die Beziehung zueinander zu verstehen.

Einziger Trost hieran ist, man muss dieser Verarbeitung aktiv in den Datenschutzeinstellungen zustimmen und die komplette Datenerhebung zum Trainieren des KI-Assistenten verbleibt auf dem Smartphone. Es gibt also laut Google keine Weiterleitung an externe Server, jedenfalls zum aktuellen Stand. Aber mit dieser Freigabe katapultiert sich der User automatisch in den datenschutzrechtlichen Bereich, denn es werden ja auch die eingehenden Nachrichten zu Analysezwecken freigegeben. Man darf sich also hier fragen, was passiert, wenn der Gesprächspartner das nicht wünscht und auf seinem Smartphone diese Freigabe nicht erteilt hat? Immerhin gilt sie ja nur stationär, also auf dem eigenen Smartphone. Diese Freigabe tangiert gleichzeitig auch das Urheberrecht. Niemand außer dem Urheber hat das Recht, über die eigenen Inhalte zu entscheiden. Genau das passiert hier aber. Damit zeigt sich, dass auch Google das Urheberrecht als hinderlich ansieht und ignoriert.

Fazit

Jeder einzelne Nutzer des Internets ist von der Datenerhebung durch die KI-Unternehmen betroffen, weil jeder von uns auf irgendeine Weise Urheber ist. Sei es, weil wir ein von uns gemachtes Foto der Öffentlichkeit zeigen, weil wir mit unserem besten Freund chatten oder ihm sogar eine Sprachnachricht schicken. All das sind heißbegehrte Daten für die KI-Unternehmen. Und jetzt stellt euch mal vor, was alles passieren würde, wenn das Urheberrecht fiele. Wir alle hängen dann am Tropf und bluten aus bis an unser Lebensende, und die gesamte Welt kann alles und jederzeit davon abrufen oder präsentiert bekommen, alleine weil eine KI das durch ihre Parameter so entscheidet.

Eure Rike Moor.