
大規模言語モデル(LLM)の訓練を争点とする2件の著作権侵害訴訟において、フェアユースを根拠に被告側への即決判決が下された。1件はMetaのLlama LLMに関するもの[1]、もう1件はAnthropicのClaude LLMに関するものである[2]。これらの判決は生成AI産業の継続的な発展にとって好材料であり、ひいては生成AI技術スタックの基盤層および上位層を構築する半導体産業にとっても追い風となる。
いずれのケースにおいても、著作者は自身の著作物の無断ダウンロード、および大規模言語モデル(LLM)の訓練目的での複製・利用に異議を唱えた。Anthropicのケースでは、汎用デジタルライブラリの構築に対しても異議が申し立てられた。いずれのケースも、LLMの出力を対象とした異議申し立ては含まれていなかった。
LLMトレーニング
大規模言語モデル(LLM)の訓練には膨大な量のテキスト(ClaudeやLlamaの場合、数百万冊の書籍を含む)が使用され、これらは多段階プロセスで処理される。まず各テキストが「トークン」と呼ばれる短い単語と句読点の列に分割され、これが訓練の単位となる。 次に、統計的言語モデルを用いてこれらの「トークン化された」テキストからパターンを学習します。具体的には、先行する単語の文脈からシーケンス内の次の単語を予測し、このプロセスを繰り返します。 予測結果は原文と比較され、統計モデルは次回より正確に予測できるよう調整される。この統計言語モデルは「ベクトル」を用いて動作する。ベクトルとは多次元行列の一種であり、異なる単語・文法パターン・物語テーマ間の関連性(「重み」と呼ばれる)を捉える。 概括的に言えば、Anthropic裁判所は、訓練を「あらゆるテキスト断片とあらゆるテキスト断片の連続との間の統計的関係を反復的にマッピングする」プロセスと説明した。これにより完成したLLMは、あたかも人間がプロンプトを読み応答を書き出すかのように、新たなテキスト入力を受け取り新たなテキスト出力を返すことができるようになる。
著作権法とフェアユース
1976年著作権法の背景にある政策は、著作者が新たな創作活動を行うことを奨励することにより、科学と芸術の進歩を促進することにある。同法第106条は、複製、二次的著作物の作成、複製物の頒布など列挙された行為について著作権者に排他的権利を認めるものである。著作権対象作品のあらゆる利用に対する独占権を認めるものではない。 著作権法第107条は、著作権者の排他的権利を侵害する行為に対して「フェアユース」の抗弁を認めており、その判断基準には以下の四要素が含まれる:
(1) 利用の目的と性質(当該利用が商業的性質のものか、非営利の教育目的のためのものであるかを含む)
(2) 著作物の性質;
(3) 使用された部分の量及び重要性(著作物全体に対する関係において);及び
(4) その使用が著作権のある作品の潜在的な市場または価値に及ぼす影響。
フェアユースは包括的に適用される積極的抗弁であり、「衡平法上の合理性の原則」と評されてきた。[3]裁判所は通常、第一要素と第四要素を最も重要視しており、特に第四要素が極めて重要である。
人選択的決定
Anthropicが使用した資料には、海賊版ソースからダウンロードした数百万冊の書籍と、Anthropicが購入し機械可読テキストとしてデジタル化スキャンした数百万冊の印刷書籍が含まれていた。これは将来的な利用を見据えた総合研究図書館の構築と、Claudeのトレーニングの両方の目的のためであった。
アルサップ判事は、分析を二分した。一つはLLMの訓練のための書籍使用、もう一つは中央図書館構築のための書籍使用である。判事は、訓練目的の使用と中央図書館構築のための購入書籍のデジタル化はフェアユースであると判断したが、中央図書館構築のための海賊版書籍の使用はフェアユースではないと結論付けた。また、中央図書館から作成される将来の複製物でLLM訓練に使用されないものについては、即決判決が及ばないことを明確にした。
第一の要素に関して、アルサップ判事は、著作権対象作品をLLMの訓練に使用して新たなテキストを生成する目的と性質は「本質的に変容的」であると判断した。この使用は単に訓練対象作品を記憶・複製するものではなく、「作家を志す読者のように」それらから学び、異なるものを創造する行為であった。したがって、訓練用コピーについては、第一の要素がフェアユースに有利に働いた。
中央図書館構築に使用された複製物について、アルサップ判事は分析を二分した。すなわち、海賊版と、アンソロピック社が印刷物で購入後デジタル変換した複製物である。判事は後者について、保存と検索性を向上させ、第三者との新たな複製物共有を伴わない点から、変容的利用であると判断した。 一方、アルサップ判事は、海賊版作品の使用は「本質的に、救いようのない侵害行為」であり、研究図書館構築のための使用は変容的ではないと判断した。判事は、購入・貸出が不可能な複製物の使用、複製物が著しく異なる形態に変容された場合、被告が既に正規の複製物を所有していた場合など、他の判例との相違点を明確に区別した。
アルサップ判事は、第二の要素——著作物の性質——がフェアユースに不利に働くとの判断を示した。問題の著作物は表現的内容を含むものであり、事実に基づく著作物よりも著作権法上より強い保護を受けるべきであるためである。
アルサップ判事は、第三の要素——使用された著作物の量と実質性——は、複製目的との関係において著作権保護対象物の量が合理的かどうかを評価するものであると判示した。 分析の鍵は、テキストの複製量ではなく、公衆に提供された量にある。訓練に関しては、アルサップ判事は書籍全体が使用されたものの、その素材が出力として公衆に提供されたとの主張はなかったと判断した。 判事は、Anthropic社がLLM(大規模言語モデル)の訓練に合理的に必要としたデータ量が膨大であったことから、訓練目的においては第三要素がフェアユースを支持すると判断した。中央ライブラリの構築に関しては、判事は第三要素が購入したコピーについてはフェアユースを支持するが、海賊版コピーについてはAnthropic社がそれらを保持する権利を全く有していないことを考慮し、フェアユースに反すると判断した。
アルサップ判事は、第四の要素である市場希釈化についても、LLMの訓練に関するフェアユースを支持すると判断した。同判事は、第四の要素は、争われている使用が著作権対象作品の実際の、または潜在的な市場代替としてどの程度機能するかに焦点を当てていると述べた。アルサップ判事は、著作者側がLLMが自身の作品の完全な複製や侵害的な模倣品を生成しないことを認めている点を指摘した。 代わりに原告側は、LLMが「自作品と競合する作品の爆発的増加をもたらす」と主張した。アルサップ判事は、この主張を「小学生に文章力を訓練させる行為も競合作品の爆発的増加を招く」という苦情に例え、「これは著作権法が懸念する競争的・創造的置換ではない」と判示した。 同法は著作者の競争からの保護ではなく、独創的な著作物の促進を目的としている」( Sega Enterprises Ltd. V. Accolade, Inc., 977 F.2d 1510, 1523-24 (9th Cir. 1992) を引用)。 アルサップ判事はまた、LLMの訓練がLLM訓練用作品のライセンス市場を損なうという原告の主張を退け、著作権法は原告に、発展する可能性のあるそのような市場を利用する権利を与えないと判示した。
アルサップ判事は、購入された図書館蔵書がデジタル形式に変換された点については第四要素が中立的であると判断した。一方で、海賊版作品については、海賊版が原告の書籍に対する「需要を明らかに代替した」ことを踏まえ、公正利用に不利に働くとした。
アルサップ判事は、あらゆる要素を総合的に考慮した結果、デジタル図書館構築のために合法的に購入されたトレーニング用コピー及び書籍に関するフェアユース問題について、アンソロピック社の即決判決請求を認めた。しかし、海賊版コピーに関しては即決判決を却下し、その判断を本審理に留保した。
メタ決定
メタ社に対する判決は、13名の著者が同社を提訴した訴訟に関わるもので、同社がいわゆる「シャドーライブラリ」と呼ばれる海賊版作品から彼らの著作物をダウンロードし、自社の大規模言語モデル(LLM)の訓練に使用したことが争点となった。 両判決の主な相違点は、チャブリア判事が第四要素に主たる重きを置いたこと、および長文の判示で表明した見解——多くの場合、LLMの行為は「訓練対象資料の市場を劇的に損なう」ためフェアユース基準を満たさない可能性がある——にあった。 チャブリア判事は例として、庭の手入れ方法に関する無限の書籍を生成できるLLMが、人間が執筆した園芸書の市場を大幅に縮小する可能性があると推測した。 同判事は、アルソップ判事のAnthropic判決が「生成AIの変容的性質(フェアユース分析の第一要素)に過度に焦点を当てた一方で、訓練対象作品の市場に与える損害への懸念を軽視した」(第四要素)と指摘した。 したがってチャブリア判事は、アルソップ判事がセガ事件を根拠に断固として退けた「市場希薄化」の主張を支持する姿勢を示した。この理論は米国著作権局も2025年5月報告書「著作権と人工知能」で支持しているが、「未開拓領域」であることを認めている。 チャブリア判事は市場希釈分析に関連する複数の疑問点を提起した。具体的には、ラマが書籍を生成可能か、可能であればどのような種類の書籍か、競争に与える影響は何か、原告の書籍を訓練に使用できる場合と使用できない場合で、原告の書籍市場に与える影響は何か、といった点である。
両裁判官は、第四の要素に関する別の主張、すなわちLLMの無許可トレーニングがLLMトレーニング用書籍のライセンス市場を損なったとする主張を退けた。両裁判所は、これが著作権法が原告に利用を認める種類の市場ではないと判断した。
第一の要素に関しては、チャブリア判事も最終的にLLMの使用が変容的利用(transformative use)であることに同意した。これは第一の要素がフェアユースに有利であると判断する上で鍵となる。しかしチャブリア判事は、分析の焦点をLLMのトレーニングという単一の「利用」に置くべきかどうかについて、アルサップ判事とは異なるアプローチを取った。 チャブリア判事は、原告側が分析を「メタ社による書籍のダウンロード」と「LLM訓練のための書籍利用」に二分しようとする試みを退け、ダウンロード行為はLLM訓練という最終目的を踏まえて考慮されねばならないと述べた。 アルサップ判事は、単純なダウンロードではなくライブラリ構築に関して、二分した分析を認めた。この二分したアプローチを用い、アルサップ判事はライブラリ内の海賊版作品の使用がフェアユースに不利に働くとの判断を示した。一方チャブリア判事は、単一分析に関連してシャドーライブラリの使用のみを考慮し、その重要性を退けた。 チャブリア判事は、悪意の有無に関する問題には関連性があり、メタ社のダウンロード行為がシャドーライブラリの永続化に寄与したピアツーピアファイル共有の一部であった場合、重要な要素となり得たが、本件では該当しないと判断した。
LLMの将来の発展にとってどのような意味を持つのか?
大規模言語モデル(LLM)の重要な変革的性質が明確に認識されており、これはフェアユースを支持する重要な要素である。今後の判決における弱点は、チャブリア判事が市場希釈テストを支持した点だ。しかしこの支持は、同判事が提起した関連する疑問を踏まえて検討すべきである。重要なのは、この検討が市場の性質に大きく依存する点だ。 現時点では、LLM利用者の大半が小説を執筆しているわけではないと推測されるため、競合するLLM生成小説の「爆発的増加」はあくまで理論上の懸念に留まる可能性が高い。しかしニュース記事や伝記、その他ノンフィクションなど、LLMによって大量かつ迅速に生成可能な作品群については、チャブリア判事が市場希薄化の懸念を示唆している。 チャブリア判事の示唆はテキスト作品以外にも適用される。例えば特定の作曲家の楽曲カタログで訓練されたLLMは、そのアーティストの音楽やアーティスト固有のジャンル市場を希薄化する作品を生産し、当該分野での創作意欲を損なう可能性がある。市場希薄化理論が司法的に支持される場合、適切な規制枠組みが市場希薄化主張への曝露を制限し得る。
判決から得られるもう一つの教訓は、研修に関連して海賊版作品を使用することは避けるべきだということである。Anthropic事件では、書籍が海賊版であった事実がフェアユースの認定に大きく不利に働いた。またMeta事件では、チャブリア判事も海賊版作品の使用がフェアユースの分析に関連し得る可能性を排除しなかった。
第三の教訓は、両判決においてLLMが訓練資料からごく短い文章しか再現できなかった点が重要であったことだ。したがってLLMは、訓練資料の広範な文章を記憶・再生するのを防ぐガードレールを今後も組み込むべきである。例えばチャブリア判事の判決は、Llamaが特定の訓練ソースから50語以上を返さないよう設定されていた点を強調している。
関連する点として、これらの事例は出力物には関与していなかった。したがって、これらの判決は、LLMが生成プロセスまたは記憶化を通じて著作権保護対象作品の無許可複製を生成する状況には言及していない。
前述の通り、これらの判決は生成AI産業にブレーキをかける説得力のある理由を提供しておらず、市場もそう解釈していないようだ。継続的な成長は、その成長を支えるために必要な半導体製品へのさらなる需要を牽引するだろう。さらに、将来の訴訟で著作権侵害が認められた場合でも、非侵害用途の存在に基づく抗弁など、利用可能な防御手段を考慮すれば、半導体メーカーの二次的責任リスクは軽微と見なされる。
[1] カドレイ対メタ・プラットフォームズ社事件、第3:23-cv-03417-VC号(カリフォルニア州北部地区連邦地方裁判所、2025年6月25日)
[2] バートズ対アンソロピックPBC事件、第3:24-cv-05417-WHA号(北カリフォルニア地区連邦地方裁判所、2025年6月23日)
[3]Google LLC 対 Oracle Am., Inc. 事件、合衆国最高裁判所判例集第593巻1頁、19頁(2021年)。