©270961762 - stock.adobe.com

Der TDM-Vorbehalt: Schutz von Urheberrechten im digitalen Zeitalter: Ein Blick auf § 44b UrhG

Rechtliche Grundlagen und Wirksamkeit

Dieser Artikel beantwortet Ihnen folgende Fragen:

Was ist der TDM-Vorbehalt?
Welche Methoden gibt es, um eigene Werke vor einer Fremdverwertung zu schützen?
Wie kann urheberrechtlich mit generativer KI umgegangen werden?

Das Urheberrecht ist ein grundlegendes Prinzip, das die Rechte von Kreativen schützt und sicherstellt, dass sie angemessen für ihre Werke entschädigt werden. In der digitalen Ära hat sich die Art und Weise, wie wir Inhalte konsumieren und weiterverbreiten, jedoch dramatisch verändert. In diesem Kontext ist § 44b des Urheberrechtsgesetzes (UrhG) zu einem wichtigen Bestandteil geworden. Doch was genau verbirgt sich hinter diesem Paragraphen, und warum ist er für die rechtssichere Nutzung urheberrechtlich geschützter Werke von so großer Bedeutung? In diesem Artikel untersuchen wir genauer, was § 44b UrhG regelt, wie er im digitalen Zeitalter anwendbar ist und welche Bedeutung er für Urheber, Nutzer und die Weiterentwicklung des Urheberrechts hat.

Liest sich ganz gut, finden Sie nicht? Der vorstehende Text wurde durch eine künstliche Intelligenz generiert (ChatGPT) und veranschaulicht die Möglichkeiten, die für publizierende Privatpersonen und Unternehmen mit dem Aufstieg der generativen KI-Systeme entstanden sind. Doch nicht jeder freut sich über den technischen Fortschritt. Einerseits lassen sich in sekundenschnelle Texte generieren, die bisher noch mühsam recherchiert und getippt werden mussten. Andererseits möchten Magazine, Blogs und andere Medien auch nach wie vor nicht auf eigenhändig recherchierte und verfasste Texte verzichten. So auch wir beim compliance insider. Für alle Gleichgesinnten stellt sich schnell die Frage, wie sich die eigenen Texte vor einer Fremdverwertung schützen lassen. Hierfür soll ja eigentlich das Urheberrecht Sorge tragen, doch hält dieses auch wirksame Mittel bereit, um die eigenen Texte und Werke zu schützen? Dieser Frage gehen wir in diesem Artikel nach, ganz ohne KI-Unterstützung.

Hintergrund

Das Training von KI, insbesondere von den sogenannten Large Language Models (LLMs) erfordert enorme Datenmengen. Hierfür werden beispielsweise frei verfügbare Bücher, Artikel aber auch öffentliche Webseiten im Rahmen des sog. Web Scrapings (auch: Screen Scraping) als Trainingsdaten erhoben. Durch Computerprogramme (Crawler) werden automatisiert Daten im Internet gesammelt, gespeichert und ausgewertet. In diesem Kontext ist insbesondere das Urheberrecht relevant. Seitens der Urheber besteht die Befürchtung, die eigenen Texte könnten im Rahmen des KI-Trainings unbemerkt weiterverwendet werden. Aufgrund der Komplexität vieler KI-Systeme lässt sich die Funktionsweise bzw. die Entscheidungsfindung von KI-Systemen häufig schwer oder gar nicht nachvollziehen (Blackbox). Entsprechend ist für viele Urheber nicht erkennbar, ob die eigenen Texte von der KI an anderer Stelle ausgegeben werden und dann von den Anwender:innen der KI-Systeme selbst weiterverwendet bzw. veröffentlicht werden.

Der TDM-Vorbehalt

In Deutschland wird das oben beschriebene Text und Data Mining in § 44b UrhG berücksichtigt. Grundsätzlich erlaubt § 44b Absatz 1 UrhG die automatisierte Analyse von digitalen Texten und Werken für die Informationsgewinnung im Rahmen des KI-Trainings. Um die Rechte der Urheber zu wahren, enthält § 44b UrhG in Absatz 3 einen Opt-out. Demnach können Urheber eine Nutzung der eigenen Werke zu Trainingszwecken nach Absatz 1 untersagen (sog. TDM-Vorbehalt). Dieser Nutzungsvorbehalt ist jedoch nur wirksam, wenn er in maschinenlesbarer Form erfolgt. Was unter der „maschinenlesbaren Form“ zu verstehen ist, wird nicht legaldefiniert. Nach der Gesetzesbegründung zu § 44b Absatz 3 UrhG kann der Hinweis auch im Impressum oder in den Allgemeinen Geschäftsbedingungen erfolgen (vorausgesetzt er ist maschinenlesbar). Problematisch ist hierbei, dass unklar ist, inwiefern der Nutzungsvorbehalt textlich eingebunden werden soll, um das Data Mining wirksam zu verhindern. Eine einheitliche Formulierung bzw. nähere Konkretisierungen wie etwa zur Sprache des Vorbehalts sucht man vergebens.

Grundsätzlich kann der Vorbehalt auch im robots.txt aufgenommen werden. Hierbei handelt es sich um einen Bestandteil des „Robots Exclusion Protocol“ welches insbesondere von Suchmaschinen und anderen Web-Crawlern „gesichtet“ wird, um Informationen über die Webseite zu erlangen. Jedoch sind Anweisungen in der robots.txt-Datei grundsätzlich nicht verpflichtend und unpräzise Angaben in der Datei können unter Umständen dazu führen, dass Suchmaschinen die Webseite nicht mehr zuverlässig einordnen können. Eine etwaige Störung könnte z.B. dazu führen, dass die Seite nicht mehr wie gewohnt in den Google Suchergebnissen ausgegeben wird.

Trotz der fehlenden gesetzlichen Verpflichtung zur Einhaltung der im robots.txt hinterlegten Anweisungen, erkennen Hersteller von KI-Systemen diese Möglichkeit zum Opt-out nun teilweise an. So beispielsweise OpenAI. Der Entwickler von ChatGPT stellt Codes zur Verfügung, durch die laut eigenen Angaben der TDM-Vorbehalt hinterlegt und durchgesetzt werden kann. Eine weitere Option zur Hinterlegung des TDM-Vorbehalts stellt darüber hinaus das „TDM Reservation Protocol“ dar. Bei dieser vom World Wide Web Consortium (W3C) entwickelten Methode wird über bestimmte Parameter direkt im HTML-Quellcode der Webseite in maschinenlesbarer Form hinterlegt, dass die Inhalte nicht durch Web-Crawler ausgelesen werden sollen. Zwar ist diese Herangehensweise explizit entwickelt worden, um den Nutzungsvorbehalt aus § 44b Abs. 3 UrhG (bzw. dessen europäische Grundlage, die EU DSM-Richtlinie) durchzusetzen, doch auch die Berücksichtigung des HTML-Quellcodes ist rechtlich nicht verpflichtend. Insgesamt fehlt es also aktuell an einer einheitlichen Praxis, über die eine Durchsetzung des TDM-Vorbehalts technisch erzwungen werden kann.

Praxistipps

Wer seine Urheberrechte schützen möchte, wird aktuell auf die Gunst der KI-Entwickler vertrauen müssen. Garantien, dass die Web-Crawler den TDM-Vorbehalt berücksichtigen, gibt es zum jetzigen Zeitpunkt keine. Entsprechend werden die Chancen gesteigert, wenn der Vorbehalt an möglichst vielen Stellen hinterlegt wird. Dann wird jedoch möglicherweise das Risiko eröffnet, dass Suchmaschinen mit der Internetseite nicht mehr wie gewohnt umgehen können. Werden seitens der KI-Anbieter Code-Snippets angeboten, um die hauseigenen Web-Crawler auszuschließen, können diese verwendet werden. Aufgrund des schnell wachsenden Marktes im Bereich KI könnte so jedoch ein Flickenteppich an verschiedenen TDM-Vorbehalten im Code entstehen, wenn alle gängigen Web-Crawler einzeln ausgeschlossen werden müssen. Auf jeden Fall sollte die Einbindung eines wirksamen Vorbehalts in maschinenlesbarer Form auch dokumentiert werden. So kann im Falle einer Verletzung des § 44b Absatz 3 UrhG durch einen KI-Anbieter nachgewiesen werden, dass die Verwendung der Texte gegen geltendes Urheberrecht verstößt.

Profitipp für Juristen

Der Nutzungsvorbehalt entfaltet seine Wirkung ex nunc (BT-Drs. 19/27426, 89). Entsprechend ist in der Dokumentation bzw. der Beweisführung im Falle eines Verstoßes die zeitliche Abfolge zu berücksichtigen. Darüber hinaus trägt der Nutzer die Beweislast für das Fehlen einen Nutzungsvorbehalts (ebd.). Dies dürfte die Durchsetzung etwaiger Ansprüche erleichtern. Die Schwierigkeit dürfte vielmehr darin bestehen, einen potenziellen Verstoß gegen § 44b UrhG überhaupt zu identifizieren.

Ausblick

Auch im Hinblick auf die Wahrung von Urheberrechten dürfte die viel diskutierte KI-Verordnung einige Antworten liefern. Zum Zeitpunkt dieses Berichts liegt die finale Fassung des Gesetzestextes noch nicht vor. Jedoch wurde in den Trilog-Verhandlungen Ende letzten Jahres eine Einigung erzielt, die unter anderem die Berücksichtigung von generativen KI-Systemen in der Verordnung umfasst. Die Anbieter von generativen KI-Systemen sollen unter anderem sicherstellen, dass die Erhebung, Analyse und Verwendung von Trainingsdaten das geltende Urheberrecht berücksichtigen. Urheber dürfen also vorsichtig optimistisch sein, dass sich in Zukunft eine Best Practice zur Hinterlegung des TDM-Vorbehalts entwickelt, die von Web-Crawlern und KI-Systemen verpflichtend einzuhalten ist.

Total
0
Shares
Prev
EuGH-Entscheidung zur Schufa: Das Urteil ist da! | 07.12.2023 (Az. C-634/21; C-26/22; C-64/22)
© Foto von AbsolutVision auf unsplash.com

EuGH-Entscheidung zur Schufa: Das Urteil ist da! | 07.12.2023 (Az. C-634/21; C-26/22; C-64/22)

Urteil der Woche

Next
Nightshade und Glaze
© Foto von Howard Bouchevereau auf unsplash.com

Nightshade und Glaze

News-Beitrag

You May Also Like