生成AIにおける盗作とオマージュの境界
2025-05-18
The Orphaned Creativity; Where Intention Matters Between Humans and Machines
出典: Plagiarism vs homage in generative AI
創造性が人間と機械の間で孤児となる理由
模倣は最も誠実な形の賛辞と言われています。あらゆるジャンルのアーティストたちは、自分たちに影響を与えた他者の作品の一部を再現することで、オマージュを表現してきました。このオマージュの範囲は、メル・ブルックスによるスター・ウォーズのパロディ「スペースボール」のような完全なパロディ作品から、以前の作品を思い起こさせる一要素や一節まで多岐にわたります。こうしたアーティストたちは大学で先人の作品を研究し、それが彼らの芸術的象徴や言語に影響を与えてきました。そして、こうしたオマージュの対象となった人々はこの模倣に対して苛立ちを表明することはほとんどなく(一部の例外はありますが)、むしろ賛辞として受け止めることが多いのです。
完全に新しいものを一から創造することは不可能です。自分で新しい言葉や文法を発明する作家はほとんどいません。それだけでなく、ほとんどのクリエイターはジャンルの制約の中で創作活動を行い、その伝統に共通する多くの定型表現やトレンドを取り入れています。これは主に必要性からくるものです。観客に理解してもらうためには、ある程度その観客の言語にアクセスし、時代精神の本質を参照する必要があります。例えば、平和を表現するために、牧歌的な風景を描くことがあります。これは観客が容易に認識できるシンボルであり、「平和」という言葉と同様に公共言語の一部なのです。
では、なぜ生成AIが学習した作品を複製する場合、オマージュではなく盗作とみなされるのでしょうか?この疑問に答えるためには、生成AIがどのようにしてまだ見たことのないものを創り出すのかを理解する必要があります。OpenAIのDall-Eなど、画像や動画を生成する現代のAIは、ランダムなノイズから始め、徐々にピクセル単位で初期コンテンツを調整し、学習した芸術のパターンにより近づけていきます。この技術は、砂浜の砂を取り、それを少しずつ砂の城へと彫刻していくようなものであり、各ステップで進捗状況を確認しながら次の調整を行います。
作品が最終的にどのようなものになるかの具体的な指定は「条件付け」によって行われます。例えばテキストプロンプトや触媒となる画像を取り込み、それを使って作品を一つの結果よりも別の結果に誘導するのです。これは、砂の城の建設者に特定のタイプの城へと偏向するよう導くようなものです。ユーザーのプロンプト以外に、AIが何か重要なことを表現しようという「意図」はありません。プロンプトが唯一の目標や目的を注入するものであり、その後AIを導く唯一の力は、すでに見たものに合わせることだけなのです。
私たちが人間のクリエイターを盗作しないと信頼するのは、彼らが自分の作品を創造する独自の動機を持っていると感じるからです。それらの動機があるため、彼らは単に以前見たものをコピーすることは不可能です。少なくとも、自分の意図に合った部分を選択する必要があり、それはコラージュのようなものです。アーティストの「訓練」期間中、つまり他者の芸術を読んだり見たり聞いたりしている時でさえ、彼らは見たものすべてを取り入れるわけではなく、自分の個人的な動機に沿った部分だけを選択します。
これに対して、純粋な言語モデル(洗練されたチャットボットではない)が「好きな映画は何か」と尋ねられた場合、さまざまな回答に相当する確率で他者が言ったことを再現するでしょう。それは映画を見たことがなく、たとえ見たとしても一方や他方を好む個人的な好みはありません。現代のチャットボットは、「人工的に」―後付けで―そのような好みを持っていないとモデルに強制することで、このような方法で人間のふりをすることを強く制限されています。そのような調整なしのデフォルトの応答は、信念を幻覚し、持っていない価値観をシミュレートすることでしょう。
生成AIは、年上の親戚を見上げて、彼らの服装、振る舞い、言葉遣いを真似し、「彼らと同じくらいカッコよくなりたい」という唯一の目標を持つ年下のいとこを思わせます。そしてこれさえも言い過ぎで、少なくともいとこにはカッコよくなりたいという動機があります。AIには何かを成し遂げるための内部的な動機が欠けており、プロンプトに応じて行動するだけです。
信頼はいつも欲求を見ることによって育まれます。人の情熱が私たちが彼らを信頼する理由です。これは生成AIに限らず、あらゆる形のAIに当てはまります。AIの外科医が手術を成功させたいと心から願っていることを知れば、単に他者の行動を模倣しているだけ—そしてその模倣が失敗した時に無思慮に混乱を引き起こす—よりも信頼できるでしょう。何かがうまくいかなくなったと感じた時に、外科医がその場で調整することを私たちは望みます。これが私たちが人間を信頼する理由です。あるいは、運転中に予期せぬものを見た時に、それを理解しようとスピードを落とす様子を考えてみてください。ただ適当に推測して盲目的にそれに固執するわけではありません。
瞬間的な意図的調整が私たちの行動を本当に私たち自身のものにします。このような能力には強化学習(RL)のようなものが必要です。RLは価値に基づいて学習する唯一の機械学習のタイプだからです。しかし、RLは複雑な状況では非常に信頼性が低いことが証明されており、そのため本番モデルはデータのパターンを模倣することに頼る傾向があります(例:行動クローニング)。
芸術的AIはまだ初期トレーニングに直接的な試行錯誤を組み込んだものはありません(RLはベースモデルの調整にのみ使用されています)。なぜなら、固有の価値に基づいて芸術を創造することを学ぶことができるようなRLモデルがまだ存在しないからです。彼らは人間のクリエイターの目標を伝達する媒体としてしか機能できません。一方、モデルに独自の動機があり、それを達成するために適切な言葉、画像、定型表現を借りるならば、私たちはそれらをクリエイターとしてより信頼するでしょう。彼らがコピー以上のことをしていることを知っているからです。
これが盗作とオマージュの違いです。オマージュは、クリエイター自身の意図を伝えるための言語として他者の作品や定型表現を使用します。一方、盗作は独自の意図がないため、意図と言語の両方をコピーします。アーティストたちは、自分の作品をコピーする人物が自分の作品を超えた何かを達成しようとしていることを知っていれば、より安心してコピーされることに同意します。その人物は、それらの欲求に合った「言葉」や部分を選択して取り入れているからです。対照的に、AIプロンプトの作成者は、コピーしている作品について何も知らないことがほとんどです。そのため、選択プロセスは完全にAIモデルの手に委ねられていますが、本質的には選択的ではありません。創造的な選択行為は「孤児」となり、ユーザーにもAI自体にも存在しません。