Beslissingen over redelijk gebruik van AI zijn gunstig voor de halfgeleiderindustrie

Onlangs werd een kort geding uitspraak gedaan ten gunste van de gedaagden op basis van redelijk gebruik in twee rechtszaken wegens schending van het auteursrecht, waarin de training van grote taalmodellen (LLM's) werd aangevochten. De ene zaak was tegen Meta met betrekking tot zijn Llama LLM's[1] en de andere tegen Anthropic met betrekking tot zijn Claude LLM's[2]. De uitspraken zijn een goed voorteken voor de verdere ontwikkeling van de generatieve AI-industrie en daarmee ook voor de halfgeleiderindustrie, die de infrastructuur en hogere lagen van de generatieve AI-technologiestack aan het uitbouwen is.
In beide gevallen hebben auteurs bezwaar gemaakt tegen het ongeoorloofd downloaden van hun auteursrechtelijk beschermde werken en het kopiëren en gebruiken ervan voor het trainen van LLM's, en in het geval van Anthropic ook tegen het opzetten van een digitale bibliotheek voor algemeen gebruik. In geen van beide gevallen werd bezwaar gemaakt tegen de output van de LLM's.
LLM-opleiding
Het trainen van een LLM omvat het gebruik van een enorm aantal teksten (waaronder, voor Claude en Llama, miljoenen boeken), die worden gekopieerd in een meerstapsproces dat begint met het vertalen van elke tekst in korte reeksen woorden en leestekens, zogenaamde 'tokens', die de eenheden vormen waarop de training wordt uitgevoerd. De training omvat vervolgens het gebruik van een statistisch taalmodel om patronen te leren uit deze 'getokeniseerde' teksten, waaronder het voorspellen van het volgende woord in een reeks, gegeven de context van de voorgaande woorden, en vervolgens het herhalen van het proces. De voorspelling wordt vergeleken met het origineel en het statistische model wordt dienovereenkomstig aangepast, zodat het de volgende keer waarschijnlijker is dat het een juiste voorspelling doet. Het statistische taalmodel werkt door middel van 'vectoren', een soort multidimensionale matrix die de verwantschap (de zogenaamde 'gewichten') van verschillende woorden, grammaticale patronen of verhaalthema's vastlegt. Op algemeen niveau beschreef de Anthropic-rechtbank training als het gebruik van de werken van de auteurs om "iteratief statistische relaties in kaart te brengen tussen elk tekstfragment en elke reeks tekstfragmenten, zodat een voltooide LLM nieuwe tekstinputs kon ontvangen en nieuwe tekstoutputs kon retourneren alsof het een mens was die prompts las en antwoorden schreef".
Auteursrecht en redelijk gebruik
Het beleid achter de Copyright Act van 1976 is gericht op het bevorderen van de vooruitgang van wetenschap en kunst door auteurs aan te moedigen nieuwe creatieve werken te maken. Artikel 106 van de Copyright Act van 1976 verleent een auteursrechthebbende exclusiviteit met betrekking tot een aantal genoemde handelingen, zoals reproductie, het maken van afgeleide werken en de distributie van kopieën. Het verleent geen monopolie op alle vormen van gebruik van het auteursrechtelijk beschermde werk. Artikel 107 van de auteursrechtwet voorziet in een positieve verdediging van "redelijk gebruik" voor handelingen die anders inbreuk zouden maken op de exclusieve rechten van een auteursrechthebbende, waarbij de toetsing op basis van de volgende vier factoren plaatsvindt:
(1) Het doel en het karakter van het gebruik, met inbegrip van de vraag of dit gebruik van commerciële aard is of voor non-profit educatieve doeleinden dient;
(2) De aard van het auteursrechtelijk beschermde werk;
(3) De omvang en het belang van het gebruikte gedeelte in verhouding tot het auteursrechtelijk beschermde werk als geheel; en
(4) Het effect van het gebruik op de potentiële markt voor of waarde van het auteursrechtelijk beschermde werk.
Fair use is een positieve verdediging die holistisch wordt toegepast en wordt omschreven als een 'billijke regel van redelijkheid'.[3] Rechtbanken beschouwen doorgaans de eerste en vierde factor als de belangrijkste, waarbij de vierde factor bijzonder belangrijk is.
De antropische beslissing
Het materiaal dat Anthropic gebruikte, omvatte miljoenen boeken die waren gedownload van illegale bronnen en miljoenen gedrukte boeken die Anthropic had aangeschaft en had gescand naar digitale vorm met machinaal leesbare tekst. Dit was zowel bedoeld om een algemene onderzoeksbibliotheek te creëren voor mogelijk toekomstig gebruik als om Claude te trainen.
Rechter Alsup splitste zijn analyse op in het gebruik van boeken voor het opleiden van de LLM en het gebruik van boeken voor het opzetten van een centrale bibliotheek. Hij oordeelde dat zowel het gebruik voor opleidingsdoeleinden als het digitaliseren van aangeschafte boeken voor het opzetten van een centrale bibliotheek onder fair use vielen, maar dat het gebruik van illegaal gekopieerde boeken voor het opzetten van een centrale bibliotheek dat niet deed. Hij maakte duidelijk dat het kort geding geen betrekking had op toekomstige kopieën die vanuit de centrale bibliotheek zouden worden gemaakt en die niet voor het opleiden van LLM's zouden worden gebruikt.
Met betrekking tot de eerste factor oordeelde rechter Alsup dat het doel en het karakter van het gebruik van auteursrechtelijk beschermde werken om LLM's te trainen om nieuwe tekst te genereren "bij uitstek transformatief" was. Het gebruik was niet alleen bedoeld om de werken waarop het was getraind uit het hoofd te leren en te repliceren, maar "als een lezer die schrijver wil worden" om ervan te leren en iets anders te creëren. Dienovereenkomstig woog de eerste factor in het voordeel van redelijk gebruik voor de trainingskopieën.
Met betrekking tot de kopieën die werden gebruikt om de centrale bibliotheek op te bouwen, splitste rechter Alsup zijn analyse op in de illegaal gekopieerde exemplaren en de exemplaren die Anthropic in gedrukte vorm had aangeschaft en vervolgens digitaal had geconverteerd. Hij oordeelde dat de laatste groep, die opslag en doorzoekbaarheid vergemakkelijkte en niet leidde tot het delen van nieuwe kopieën met derden, transformatief was. Aan de andere kant oordeelde rechter Alsup dat het gebruik van de illegaal gekopieerde werken "inherent en onherstelbaar inbreukmakend" was en dat het gebruik ervan voor de bouw van een onderzoeksbibliotheek niet transformatief was. Rechter Alsup maakte een onderscheid met andere uitspraken, waaronder gevallen waarin kopieën niet te koop of te leen waren, kopieën in een aanzienlijk andere vorm waren omgezet of de verdachte al over geautoriseerde kopieën beschikte.
Rechter Alsup oordeelde dat de tweede factor – de aard van het auteursrechtelijk beschermde werk – tegen redelijk gebruik pleitte, omdat de werken in kwestie expressieve inhoud bevatten, die op grond van het auteursrecht meer bescherming genoot dan feitelijke werken.
Rechter Alsup oordeelde dat de derde factor – de hoeveelheid en de substantie van het gebruikte werk – een beoordeling inhield van de vraag of de hoeveelheid auteursrechtelijk beschermd materiaal redelijk was in verhouding tot het doel van het kopiëren ervan. De sleutel tot de analyse was niet hoeveel tekst er was gekopieerd, maar hoeveel er voor het publiek toegankelijk was gemaakt. Met betrekking tot training oordeelde rechter Alsup dat, hoewel de volledige boeken waren gebruikt, er geen bewering was dat het materiaal als output voor het publiek beschikbaar was gemaakt. Hij oordeelde dat de derde factor in het voordeel was van redelijk gebruik voor opleidingsdoeleinden, vanwege de grote hoeveelheid gegevens die Anthropic redelijkerwijs nodig had voor het trainen van zijn LLM's. Met betrekking tot het opzetten van een centrale bibliotheek oordeelde rechter Alsup dat de derde factor in het voordeel was van redelijk gebruik voor de gekochte exemplaren, maar tegen redelijk gebruik voor de illegaal gekopieerde exemplaren, aangezien Anthropic helemaal geen recht had om deze in bezit te hebben.
Rechter Alsup oordeelde dat ook de vierde factor – marktverwatering – in het voordeel was van redelijk gebruik met betrekking tot het trainen van LLM's. Hij oordeelde dat de vierde factor zich richt op de mate waarin het betwiste gebruik fungeert als een daadwerkelijke of potentiële marktsubstitutie voor het auteursrechtelijk beschermde werk. Rechter Alsup merkte op dat de auteurs toegaven dat de LLM's geen exacte kopieën of inbreukmakende namaakproducten van de werken van de auteurs produceerden. In plaats daarvan voerden de auteurs aan dat de LLM's zouden "leiden tot een explosie van werken die concurreren met hun werken". Rechter Alsup vergeleek het argument van de eisers met een klacht dat "het trainen van schoolkinderen om goed te schrijven" ook zou leiden tot een explosie van concurrerende werken en oordeelde dat dit "niet het soort concurrentie of creatieve verdringing is waar de auteursrechtwet zich mee bezighoudt. De wet beoogt originele auteurswerken te bevorderen, niet auteurs te beschermen tegen concurrentie" (onder verwijzing naar Sega Enterprises Ltd. V. Accolade, Inc., 977 F.2d 1510, 1523-24 (9th Cir. 1992)). Rechter Alsup verwierp ook de argumenten van de eisers dat het trainen van LLM's schadelijk zou zijn voor een opkomende markt voor het in licentie geven van werk om LLM's te trainen, en oordeelde dat de auteurswet de eisers niet het recht geeft om een dergelijke markt die zich zou kunnen ontwikkelen, te exploiteren.
Rechter Alsup oordeelde dat de vierde factor neutraal was met betrekking tot de gekochte bibliotheekexemplaren die naar digitale vorm waren omgezet, en wees op oneerlijk gebruik van de illegaal gekopieerde werken, aangezien illegaal gekopieerde exemplaren "duidelijk de vraag naar" de boeken van de eisers hadden verdrongen.
Rechter Alsup heeft alle factoren afgewogen en heeft vervolgens het verzoek van Anthropic om een kort geding uitspraak over de kwestie van redelijk gebruik met betrekking tot de trainingskopieën en boeken die legaal zijn aangeschaft om een digitale bibliotheek op te bouwen, toegewezen, maar heeft het verzoek van Anthropic om een kort geding uitspraak over de illegale kopieën afgewezen en de beslissing voor de rechtszaak aangehouden.
De meta-beslissing
De Meta-uitspraak betrof een rechtszaak van 13 auteurs tegen Meta wegens het downloaden van hun werken uit zogenaamde "schaduwbibliotheken" met illegaal gekopieerde werken en het gebruik daarvan voor het trainen van Meta's LLM. Een belangrijk verschil tussen de twee uitspraken was het primaire gewicht dat rechter Chhabria toekende aan de vierde factor en zijn mening, verwoord in een uitgebreid dictum, dat LLM-gedrag in veel gevallen niet voldoet aan de fair use-test omdat LLM's vaak "de markt voor de materialen waarop ze worden getraind drastisch ondermijnen". Als voorbeeld speculeerde rechter Chhabria dat een LLM die in staat is om eindeloos veel boeken te produceren over hoe je een tuin moet onderhouden, de markt voor door mensen geschreven tuinboeken aanzienlijk zou kunnen verkleinen. Hij gaf aan dat de uitspraak van rechter Alsop in de zaak Anthropic te veel gericht was op het transformatieve karakter van generatieve AI (de eerste factor in de analyse van redelijk gebruik), "terwijl hij de bezorgdheid over de schade die dit kan toebrengen aan de markt voor de werken waarop het wordt getraind" (de vierde factor) terzijde schoof. Rechter Chhabria leek daarom een argument van marktverwatering te onderschrijven dat rechter Alsop op basis van Sega botweg had verworpen. Deze theorie werd onlangs ook ondersteund door het Amerikaanse Copyright Office in zijn rapport "Copyright and Artificial Intelligence" van mei 2025, hoewel het erkende dat het om "onbekend terrein" ging. Rechter Chhabria stelde een aantal vragen die verband hielden met een analyse van marktverwatering, waaronder of Llama in staat was om boeken te genereren, en zo ja, wat voor soort boeken, welke impact dit zou hebben op de concurrentie en wat de impact zou zijn op de markt voor de boeken van eisers wanneer Llama hun boeken zou kunnen gebruiken voor training versus wanneer het deze niet zou kunnen gebruiken.
Beide rechters verwierpen een ander argument met betrekking tot de vierde factor, namelijk dat de ongeoorloofde opleiding van LLM's schade toebracht aan de markt voor het in licentie geven van boeken voor LLM-opleidingen. Beide rechtbanken oordeelden dat dit niet het soort markt was dat de auteurswet de eisers het recht geeft te exploiteren.
Wat betreft de eerste factor was rechter Chhabria het uiteindelijk ook eens met het standpunt dat het gebruik van de LLM's transformatief was, wat essentieel is om te kunnen concluderen dat de eerste factor in het voordeel van redelijk gebruik spreekt. Maar rechter Chhabria nam een andere benadering dan rechter Alsup met betrekking tot de vraag of de analyse zich moest richten op LLM-training als het enige "gebruik". Rechter Chhabria verwierp de poging van de eisers om de analyse op te splitsen in het downloaden van de boeken door Meta en het gebruik van de boeken voor LLM-training, en stelde dat het downloaden moet worden bekeken in het licht van het uiteindelijke doel van LLM-training. Rechter Alsup stond een gesplitste analyse toe, zij het met betrekking tot het opbouwen van een bibliotheek, in tegenstelling tot het simpelweg downloaden. Met behulp van deze gesplitste benadering oordeelde rechter Alsup dat het gebruik van illegaal gekopieerde werken in de bibliotheek in het nadeel was van redelijk gebruik. Rechter Chhabria daarentegen beschouwde het gebruik van schaduwbibliotheken alleen in verband met zijn unitaire analyse en verwierp het belang ervan. Rechter Chhabria oordeelde dat dit weliswaar relevant was voor de kwestie van kwade trouw en van belang had kunnen zijn als het downloaden door Meta deel had uitgemaakt van een peer-to-peer-bestandsuitwisseling die had bijgedragen aan het voortbestaan van de schaduwbibliotheken, maar dat dit hier niet het geval was.
Wat zijn de implicaties voor de toekomstige ontwikkeling van LLMs?
Er is een duidelijke erkenning van het aanzienlijke transformatieve karakter van LLM's, wat een belangrijke factor is die fair use bevordert. Een zwak punt voor toekomstige beslissingen is de goedkeuring door rechter Chhabria van een marktverwateringstest. Maar deze goedkeuring moet worden bekeken in het licht van de bijbehorende vragen die hij heeft gesteld. Belangrijk is dat dit een onderzoek is dat sterk afhankelijk is van de aard van de markt. Het is (voorlopig) een veilige gok dat de meeste gebruikers van LLM's geen romans schrijven, dus de "explosie" van concurrerende, door LLM's gegenereerde romans zal uiteindelijk waarschijnlijk meer een theoretische zorg zijn. Maar voor andere werken, bijvoorbeeld nieuwsartikelen, biografieën en andere non-fictie die snel en massaal door LLM's kunnen worden geproduceerd, suggereerde rechter Chhabria dat er mogelijk zorgen zijn over marktverwatering. De uitspraak van rechter Chhabria is ook van toepassing buiten tekstgebaseerde werken. Een LLM-training op basis van het repertoire van een specifieke songwriter zou bijvoorbeeld werken kunnen produceren die de markt voor de muziek van die artiest of een genre dat uniek is voor die artiest, verwateren, waardoor de artiest en mogelijk anderen worden ontmoedigd om muziek te blijven maken in die ruimte. Passende waarborgen zouden de blootstelling aan claims van marktverwatering kunnen beperken, mocht de theorie van marktverwatering juridisch aan kracht winnen.
Een andere conclusie uit de uitspraken is dat het gebruik van illegaal gekopieerde werken in verband met opleidingen moet worden vermeden. In Anthropic woog het feit dat de boeken illegaal waren gekopieerd zwaar tegen fair use. En in Meta liet rechter Chhabria ook de mogelijkheid open dat het gebruik van illegaal gekopieerde werken relevant zou kunnen zijn voor een fair use-analyse.
Een derde conclusie is dat het in beide beslissingen belangrijk was dat de LLM's niet meer dan zeer korte passages uit het trainingsmateriaal konden reproduceren. LLM's moeten dus voorzien blijven van waarborgen die het onthouden en herhalen van uitgebreide passages uit trainingsmateriaal voorkomen. In de beslissing van rechter Chhabria werd bijvoorbeeld benadrukt dat Llama zo was geconfigureerd dat het niet meer dan 50 woorden uit een bepaalde trainingsbron kon weergeven.
Een verwant punt is dat de zaken geen output betroffen. Bijgevolg hebben de beslissingen geen betrekking op de situatie waarin een LLM een ongeoorloofde replica van een auteursrechtelijk beschermd werk produceert, hetzij via een generatief proces, hetzij via memorisatie.
Zoals hierboven aangegeven, vormen de uitspraken geen dwingende reden om de generatieve AI-industrie af te remmen, en de markten lijken ze ook niet als zodanig te hebben opgevat. De aanhoudende groei zal leiden tot een verdere vraag naar de halfgeleiderproducten die nodig zijn om die groei te ondersteunen. Bovendien lijkt het risico van secundaire aansprakelijkheid voor chipfabrikanten, zelfs als er in een toekomstige zaak sprake zou zijn van inbreuk op het auteursrecht, triviaal gezien de beschikbare verweermiddelen, zoals die welke zijn gebaseerd op het bestaan van niet-inbreukmakend gebruik.
[1] Kadrey tegen Meta Platforms, Inc., nr. 3:23-cv-03417-VC (N.D. Cal. 25 juni 2025)
[2] Bartz tegen Anthropic PBC, nr. 3:24-cv-05417-WHA (N.D. Cal. 23 juni 2025)
[3] Google LLC tegen Oracle Am., Inc., 593 U.S. 1, 19 (2021).