Entscheidungen zum fairen Gebrauch von KI sind ein gutes Zeichen für die Halbleiterindustrie

In zwei Urheberrechtsverletzungsklagen, in denen die Ausbildung großer Sprachmodelle (LLMs) angefochten wurde, wurde kürzlich aufgrund der fairen Nutzung ein summarisches Urteil zugunsten der Beklagten gefällt. Eine Klage richtete sich gegen Meta in Bezug auf dessen Llama-LLMs[1], die andere gegen Anthropic in Bezug auf dessen Claude-LLMs[2]. Die Entscheidungen sind ein gutes Zeichen für die weitere Entwicklung der generativen KI-Branche und damit auch für die Halbleiterindustrie, die die Infrastruktur und die höheren Schichten des generativen KI-Technologie-Stacks aufbaut.
In beiden Fällen beanstandeten die Autoren das unbefugte Herunterladen ihrer urheberrechtlich geschützten Werke sowie deren Vervielfältigung und Verwendung für das Training von LLMs. Im Fall von Anthropic wurde außerdem die Einrichtung einer universellen digitalen Bibliothek beanstandet. In keinem der beiden Fälle wurden die Ergebnisse der LLMs beanstandet.
LLM-Ausbildung
Das Training eines LLM umfasst die Verwendung einer enormen Anzahl von Texten (einschließlich Millionen von Büchern für Claude und Llama), die in einem mehrstufigen Prozess kopiert werden, der damit beginnt, dass jeder Text in kurze Wort- und Satzzeichenfolgen, sogenannte „Tokens“, übersetzt wird, die die Einheiten bilden, auf denen das Training basiert. Das Training umfasst dann die Verwendung eines statistischen Sprachmodells, um Muster aus diesen „tokenisierten” Texten zu lernen, einschließlich der Vorhersage des nächsten Wortes in einer Sequenz unter Berücksichtigung des Kontexts der vorangehenden Wörter, und dann die Wiederholung des Prozesses. Die Vorhersage wird mit dem Original verglichen und das statistische Modell entsprechend angepasst, damit es beim nächsten Mal mit größerer Wahrscheinlichkeit eine korrekte Vorhersage trifft. Das statistische Sprachmodell arbeitet mit „Vektoren“, einer Art mehrdimensionaler Matrix, die die Verwandtschaft (sogenannte „Gewichte“) verschiedener Wörter, Grammatikmuster oder Story-Themen erfasst. Auf einer allgemeinen Ebene beschrieb das Anthropic- Gericht das Training als die Verwendung der Werke der Autoren, um „iterativ statistische Beziehungen zwischen jedem Textfragment und jeder Sequenz von Textfragmenten abzubilden, sodass ein fertiges LLM neue Texteingaben empfangen und neue Textausgaben zurückgeben kann, als wäre es ein Mensch, der Eingaben liest und Antworten schreibt”.
Urheberrecht und faire Nutzung
Die Politik hinter dem Urheberrechtsgesetz von 1976 besteht darin, den Fortschritt von Wissenschaft und Kunst zu fördern, indem Autoren dazu ermutigt werden, neue kreative Werke zu schaffen. Abschnitt 106 des Urheberrechtsgesetzes von 1976 gewährt einem Urheberrechtsinhaber das ausschließliche Recht in Bezug auf bestimmte Handlungen, wie z. B. die Vervielfältigung, die Erstellung abgeleiteter Werke und die Verbreitung von Kopien. Es gewährt jedoch kein Monopol auf alle Verwendungen des urheberrechtlich geschützten Werks. Abschnitt 107 des Urheberrechtsgesetzes sieht eine positive Verteidigung der „fairen Nutzung” für Handlungen vor, die ansonsten die ausschließlichen Rechte eines Urheberrechtsinhabers verletzen würden. Die Prüfung hierfür umfasst die folgenden vier Faktoren:
(1) Zweck und Art der Nutzung, einschließlich der Angabe, ob es sich um eine kommerzielle Nutzung oder um eine Nutzung für gemeinnützige Bildungszwecke handelt;
(2) Die Art des urheberrechtlich geschützten Werks;
(3) Der Umfang und die Wesentlichkeit des verwendeten Teils im Verhältnis zum urheberrechtlich geschützten Werk insgesamt; und
(4) Die Auswirkungen der Nutzung auf den potenziellen Markt oder den Wert des urheberrechtlich geschützten Werks.
Fair Use ist eine positive Verteidigung, die ganzheitlich angewendet wird und als „gerechte Regel der Vernunft” beschrieben wurde.[3] Gerichte haben in der Regel den ersten und vierten Faktor als die wichtigsten angesehen, wobei der vierte Faktor besonders wichtig ist.
Die anthropische Entscheidung
Zu den von Anthropic verwendeten Materialien gehörten Millionen von Büchern, die aus illegalen Quellen heruntergeladen wurden, sowie Millionen von gedruckten Büchern, die Anthropic gekauft und in digitale Form mit maschinenlesbarem Text gescannt hat. Dies diente sowohl dem Zweck, eine allgemeine Forschungsbibliothek für eine mögliche zukünftige Nutzung aufzubauen, als auch dem Training von Claude.
Richter Alsup unterteilte seine Analyse in die Verwendung von Büchern für die Ausbildung von LLMs und die Verwendung von Büchern zum Aufbau einer Zentralbibliothek. Er befand, dass sowohl die Verwendung für Ausbildungszwecke als auch die Digitalisierung gekaufter Bücher zum Aufbau einer Zentralbibliothek eine faire Nutzung darstellten, die Verwendung von Raubkopien zum Aufbau einer Zentralbibliothek jedoch nicht. Er stellte klar, dass sich das summarische Urteil nicht auf zukünftige Kopien aus der Zentralbibliothek erstreckte, die nicht für die Ausbildung von LLMs verwendet wurden.
In Bezug auf den ersten Faktor befand Richter Alsup, dass der Zweck und Charakter der Verwendung der urheberrechtlich geschützten Werke zur Schulung von LLMs zur Generierung neuer Texte „im Wesentlichen transformativ“ sei. Die Verwendung diente nicht einfach dazu, die Werke, auf denen das Training basierte, auswendig zu lernen und zu reproduzieren, sondern „wie ein Leser, der Schriftsteller werden möchte“, um aus ihnen zu lernen und etwas Neues zu schaffen. Dementsprechend sprach der erste Faktor für eine faire Nutzung der Schulungskopien.
In Bezug auf die Kopien, die zum Aufbau der Zentralbibliothek verwendet wurden, unterteilte Richter Alsup seine Analyse in Raubkopien und solche, die Anthropic in gedruckter Form gekauft und dann digitalisiert hatte. Er befand, dass die letztere Gruppe, die die Speicherung und Durchsuchbarkeit erleichterte und nicht dazu führte, dass neue Kopien an Dritte weitergegeben wurden, transformativ war. Auf der anderen Seite befand Richter Alsup, dass die Verwendung der Raubkopien „von Natur aus und unwiderruflich rechtswidrig“ sei und ihre Verwendung zum Aufbau einer Forschungsbibliothek nicht transformativ sei. Richter Alsup unterschied andere Entscheidungen, darunter Fälle, in denen Kopien nicht zum Kauf oder zur Ausleihe verfügbar waren, Kopien in eine deutlich andere Form umgewandelt wurden oder der Beklagte bereits über autorisierte Kopien verfügte.
Richter Alsup befand, dass der zweite Faktor – die Art des urheberrechtlich geschützten Werks – gegen eine faire Nutzung sprach, da es sich bei den fraglichen Werken um Ausdrucksinhalte handelte, die nach dem Urheberrecht einen höheren Schutz genossen als Sachwerke.
Richter Alsup stellte fest, dass der dritte Faktor – Umfang und Wesentlichkeit des verwendeten Werks – eine Beurteilung darüber beinhaltete, ob der Umfang des urheberrechtlich geschützten Materials im Verhältnis zum Zweck der Vervielfältigung angemessen war. Entscheidend für die Analyse war nicht, wie viel Text kopiert wurde, sondern wie viel der Öffentlichkeit zugänglich gemacht wurde. In Bezug auf die Schulung stellte Richter Alsup fest, dass zwar die gesamten Bücher verwendet wurden, aber nicht behauptet wurde, dass das Material der Öffentlichkeit als Ergebnis zugänglich gemacht wurde. Er stellte fest, dass der dritte Faktor aufgrund der großen Datenmenge, die Anthropic für das Training seiner LLMs vernünftigerweise benötigte, für eine faire Nutzung zu Trainingszwecken sprach. In Bezug auf den Aufbau einer zentralen Bibliothek stellte Richter Alsup fest, dass der dritte Faktor für eine faire Nutzung der gekauften Kopien sprach, jedoch gegen eine faire Nutzung der raubkopierten Kopien, da Anthropic überhaupt kein Recht hatte, diese zu besitzen.
Richter Alsup befand, dass auch der vierte Faktor – die Marktverwässerung – für eine faire Nutzung im Zusammenhang mit dem Training von LLMs sprach. Er stellte fest, dass sich der vierte Faktor darauf konzentriert, inwieweit die beanstandete Nutzung als tatsächlicher oder potenzieller Marktersatz für das urheberrechtlich geschützte Werk fungiert. Richter Alsup merkte an, dass die Autoren eingeräumt hätten, dass die LLMs keine exakten Kopien oder rechtsverletzenden Nachahmungen der Werke der Autoren produzierten. Stattdessen argumentierten die Autoren, dass die LLMs „zu einer Explosion von Werken führen würden, die mit ihren Werken konkurrieren”. Richter Alsup verglich das Argument der Kläger mit der Behauptung, dass „das Training von Schulkindern, gut zu schreiben” ebenfalls zu einer Explosion konkurrierender Werke führen würde, und stellte fest, dass dies „nicht die Art von Wettbewerbs- oder Kreativitätsverdrängung ist, die das Urheberrechtsgesetz betrifft. Das Gesetz zielt darauf ab, originelle Werke von Urhebern zu fördern, nicht darauf, Autoren vor Wettbewerb zu schützen“ (unter Verweis auf Sega Enterprises Ltd. V. Accolade, Inc., 977 F.2d 1510, 1523-24 (9th Cir. 1992)). Richter Alsup wies auch die Argumente der Kläger zurück, dass das Training von LLMs einen aufstrebenden Markt für die Lizenzierung von Arbeiten zum Training von LLMs schädigen würde, und stellte fest, dass das Urheberrechtsgesetz den Klägern kein Recht einräumt, einen solchen Markt, der sich entwickeln könnte, zu nutzen.
Richter Alsup befand, dass der vierte Faktor in Bezug auf die gekauften Bibliotheksexemplare, die in digitale Form umgewandelt wurden, neutral war und gegen eine faire Nutzung der raubkopierten Werke sprach, da die Raubkopien „die Nachfrage nach den Büchern der Kläger eindeutig verdrängten“.
Richter Alsup wog alle Faktoren ab und gab somit dem Antrag von Anthropic auf ein summarisches Urteil in Bezug auf die Frage der fairen Nutzung von Schulungskopien und Büchern, die rechtmäßig zum Aufbau einer digitalen Bibliothek erworben wurden, statt, lehnte jedoch ein summarisches Urteil für Anthropic in Bezug auf die Raubkopien ab und behielt sich die Entscheidung für die Verhandlung vor.
Die Meta-Entscheidung
Die Meta-Entscheidung betraf eine Klage von 13 Autoren gegen Meta wegen des Herunterladens ihrer Werke aus sogenannten „Schattenbibliotheken” mit Raubkopien und deren Verwendung zum Trainieren des LLM von Meta. Ein wesentlicher Unterschied zwischen den beiden Entscheidungen bestand darin, dass Richter Chhabria dem vierten Faktor vorrangige Bedeutung beimaß und in einem ausführlichen Obiter dictum die Ansicht vertrat, dass das Verhalten von LLM in vielen Fällen den Fair-Use-Test nicht bestehen könne, da LLM häufig „den Markt für die Materialien, mit denen sie trainiert werden, dramatisch untergraben”. Als Beispiel spekulierte Richter Chhabria, dass ein LLM, das in der Lage ist, unendlich viele Bücher über die Pflege eines Gartens zu produzieren, den Markt für von Menschen verfasste Gartenbücher erheblich schmälern könnte. Er wies darauf hin, dass sich die Entscheidung von Richter Alsop in der Rechtssache Anthropic zu sehr auf den transformativen Charakter generativer KI (der erste Faktor in der Fair-Use-Analyse) konzentrierte, „während Bedenken hinsichtlich des Schadens, den sie dem Markt für die Werke, auf denen sie trainiert wird, zufügen kann” (der vierte Faktor), beiseite geschoben wurden. Richter Chhabria schien daher ein Argument der Marktverwässerung zu unterstützen, das Richter Alsop auf der Grundlage von Sega rundweg abgelehnt hatte. Diese Theorie wurde kürzlich auch vom US-amerikanischen Copyright Office in seinem Bericht „Copyright and Artificial Intelligence” vom Mai 2025 unterstützt, obwohl es sich um „Neuland” handele. Richter Chhabria warf eine Reihe von Fragen auf, die mit einer Marktverwässerungsanalyse zusammenhängen, darunter die Frage, ob Llama in der Lage ist, Bücher zu generieren, und wenn ja, welche Art von Büchern, welche Auswirkungen dies auf den Wettbewerb hätte und welche Auswirkungen es auf den Markt für die Bücher der Kläger hätte, wenn Llama ihre Bücher für das Training verwenden könnte, im Gegensatz dazu, wenn es sie nicht verwenden könnte.
Beide Richter wiesen ein weiteres Argument zum vierten Faktor zurück, wonach die nicht genehmigte Ausbildung von LLMs den Markt für die Lizenzierung von Büchern für die LLM-Ausbildung beeinträchtigt habe. Beide Gerichte befanden, dass es sich hierbei nicht um die Art von Markt handele, zu dessen Nutzung die Kläger gemäß dem Urheberrechtsgesetz berechtigt seien.
In Bezug auf den ersten Faktor stimmte Richter Chhabria letztendlich ebenfalls zu, dass die Verwendung der LLMs transformativ war, was entscheidend dafür ist, dass der erste Faktor für eine faire Nutzung spricht. Allerdings vertrat Richter Chhabria eine andere Auffassung als Richter Alsup hinsichtlich der Frage, ob sich die Analyse auf das Training der LLMs als einzige „Verwendung” konzentrieren sollte. Richter Chhabria lehnte den Versuch der Kläger ab, die Analyse in das Herunterladen der Bücher durch Meta und die Verwendung der Bücher für das Training der LLMs zu unterteilen, und erklärte, dass das Herunterladen im Lichte des letztendlichen Zwecks des Trainings der LLMs betrachtet werden müsse. Richter Alsup ließ eine geteilte Analyse zu, allerdings in Bezug auf den Aufbau einer Bibliothek und nicht nur auf das einfache Herunterladen. Unter Verwendung dieses geteilten Ansatzes entschied Richter Alsup, dass die Nutzung von Raubkopien in der Bibliothek gegen eine faire Nutzung sprach. Richter Chhabria hingegen berücksichtigte die Nutzung von Schattenbibliotheken nur im Zusammenhang mit seiner einheitlichen Analyse und wies deren Bedeutung zurück. Richter Chhabria entschied, dass dies zwar für die Frage der Bösgläubigkeit relevant sei und von Bedeutung hätte sein können, wenn das Herunterladen durch Meta Teil einer Peer-to-Peer-Dateifreigabe gewesen wäre, die zur Aufrechterhaltung der Schattenbibliotheken beigetragen hätte, dies hier jedoch nicht der Fall sei.
Was bedeutet das für die zukünftige Entwicklung von LLMs?
Es besteht ein klares Bewusstsein für den bedeutenden transformativen Charakter von LLMs, was ein wichtiger Faktor für die Förderung der fairen Nutzung ist. Ein Schwachpunkt für zukünftige Entscheidungen ist die Befürwortung eines Marktverwässerungstests durch Richter Chhabria. Diese Befürwortung sollte jedoch im Lichte der damit verbundenen Fragen betrachtet werden, die er aufgeworfen hat. Wichtig ist, dass es sich hierbei um eine Untersuchung handelt, die stark von der Beschaffenheit des Marktes abhängt. Man kann (vorerst) davon ausgehen, dass die meisten Nutzer von LLMs keine Romane schreiben, sodass die „Explosion” konkurrierender, von LLMs generierter Romane eher ein theoretisches Problem sein dürfte. Bei anderen Werken jedoch, beispielsweise Nachrichtenartikeln, Biografien und anderen Sachtexten, die von LLMs schnell in großer Zahl produziert werden können, könnte es laut Richter Chhabria zu einer Verwässerung des Marktes kommen. Die Feststellung von Richter Chhabria gilt auch außerhalb von textbasierten Werken. Beispielsweise könnte ein LLM-Training auf der Grundlage des Katalogs eines bestimmten Songwriters Werke hervorbringen, die den Markt für die Musik dieses Künstlers oder für ein mit diesem Künstler einzigartig verbundenes Genre verwässern und den Künstler und möglicherweise auch andere davon abhalten, weiterhin Musik in diesem Bereich zu machen. Angemessene Schutzmaßnahmen könnten das Risiko von Klagen wegen Marktverwässerung begrenzen, sollte die Theorie der Marktverwässerung in der Rechtsprechung an Bedeutung gewinnen.
Eine weitere Erkenntnis aus den Entscheidungen ist, dass die Verwendung von Raubkopien im Zusammenhang mit Schulungen vermieden werden sollte. Im Fall Anthropic wurde die Tatsache, dass es sich um Raubkopien handelte, stark gegen eine faire Nutzung gewertet. Und im Fall Meta ließ Richter Chhabria ebenfalls die Möglichkeit offen, dass die Verwendung von Raubkopien für eine Analyse der fairen Nutzung relevant sein könnte.
Eine dritte Erkenntnis ist, dass es in beiden Entscheidungen wichtig war, dass die LLMs nur sehr kurze Passagen aus den Trainingsmaterialien reproduzieren konnten. Daher sollten LLMs weiterhin Schutzvorrichtungen enthalten, die das Auswendiglernen und Wiedergeben umfangreicher Passagen aus Trainingsmaterialien verhindern. So betonte Richter Chhabria in seiner Entscheidung, dass Llama so konfiguriert war, dass es nicht mehr als 50 Wörter aus einer bestimmten Trainingsquelle zurückgab.
Ein damit zusammenhängender Punkt ist, dass es in den Fällen nicht um Outputs ging. Folglich befassen sich die Entscheidungen nicht mit der Situation, in der ein LLM eine nicht autorisierte Kopie eines urheberrechtlich geschützten Werks erstellt, sei es durch einen generativen Prozess oder durch Speicherung.
Wie oben dargelegt, liefern die Entscheidungen keinen zwingenden Grund, die generative KI-Branche zu bremsen, und auch die Märkte scheinen dies nicht so zu sehen. Das anhaltende Wachstum wird die Nachfrage nach Halbleiterprodukten weiter ankurbeln, die zur Unterstützung dieses Wachstums benötigt werden. Selbst wenn in einem zukünftigen Fall eine Urheberrechtsverletzung festgestellt werden sollte, scheint das Risiko einer sekundären Haftung für Chiphersteller angesichts der verfügbaren Verteidigungsmöglichkeiten, wie z. B. solchen, die auf der Existenz nicht rechtsverletzender Verwendungen beruhen, gering zu sein.
[1] Kadrey gegen Meta Platforms, Inc., Nr. 3:23-cv-03417-VC (N.D. Cal. 25. Juni 2025)
[2] Bartz gegen Anthropic PBC, Nr. 3:24-cv-05417-WHA (N.D. Cal. 23. Juni 2025)
[3] Google LLC gegen Oracle Am., Inc., 593 U.S. 1, 19 (2021).