AIは創造的か?創造性の多次元的性質を探る
2025-05-05
Why We Need New Ways to Think About Machine Creativity
出典: Is AI Creative?
この記事では、創造性の定義の多様性と、その時間的・文化的性質を通じて、創造性の多次元的な本質を探求します。研究の結果、創造性の普遍的な定義は存在せず、アウトプットだけに基づいて「AIは創造的か?」という問いに答えようとすることは、創造的プロセスの複雑さや、これらの製品が機能するために必要な人間の努力とデータを軽視することになることが分かりました。1800年代の霊媒現象との類似点を描き、新しい技術に超自然的な性質を付与する傾向があることを論じ、現在、私たちがAIの創造的能力を過大評価している可能性について議論します。機械が創造的かどうかを議論するのではなく、人間と計算機の創造性の違いについて議論するための新しいメタファー、比喩、問いのライブラリーが必要だと論じます。そして最後に、生成AIを表現する新しいメタファーを提案します。生成AIはツールではなく、媒介(メディアム)なのです。
なぜこの問いは問う価値があるのか
AIが創造性や創造的コミュニティに与える影響について研究を行う過程で、繰り返し尋ねられるいくつかの質問に遭遇してきました。AI規制の進化する状況、クリエイターがどのようにAI製品を仕事に使用しているか、AI製品がクリエイターにどのように認識され、体験されているかといった質問については、前回の記事で取り上げました。
しかし、「AIは創造的か?」という問いが何度も繰り返されます。
検索エンジンにこの質問を入力すると、膨大な数のコンテンツが返されるため、私たちはこれ以上この質問に時間やコンテンツを費やさないことを強く検討しました。しかし、再検討の結果、記事を書くことにしました。なぜでしょうか?
この質問に含まれているのは、機械が単に知的であるだけでなく、創造的知性を持つことができるという示唆です。これはかつて人間と動物のためだけに確保されていた領域であり、機械的な物体のためのものではありませんでした。
2つ目の理由は、この元の質問から別の議論のテーマが生まれたことです。さまざまなメディアをアウトプットとして生成できる生成AI製品には、今や「創造性の民主化」という約束が付いています。ここでの含意は、機械が創造的であるということではなく、すべての人を創造的にするということです。
この記事では、これら両方の含意にできるだけ簡潔に答えることを試みます。
定義から始める
XがYであるかどうかを答える最も簡単な方法は、Yを定義する基準を調べ、そしてXがその基準を満たすかどうかを判断することです。「AIは創造的か?」という問いに答えようとする際の難しさは、創造性の世界的に認められた定義が存在しないことです。これまで、人間の創造性が脅威にさらされたり、競争相手を持ったりすることがなかったため、そのような定義は必要なかったとも言えるでしょう。
例えば、同じ機関が発行している2つの異なる辞書を見てみましょう。Cambridge Advanced Learner's Dictionary & Thesaurusの創造性の定義は、アイデアと創造性を結びつけています。「独創的で珍しいアイデアを生み出したり使用したりする能力」。しかし、Cambridge Academic Content Dictionaryの定義を調べると、創造行為まで含むように創造性の境界が広がります。「独創的で珍しいアイデアを生み出す能力、または何か新しいものや想像力豊かなものを作る能力」。
興味深いことに、'or'を'and'に置き換えると、新しい定義が浮かび上がります。「独創的で珍しいアイデアを生み出し、かつ何か新しいものや想像力豊かなものを作る能力」。この定義は、創造性がどのように世界に導かれるかについての非常に短い説明文のように読めます。この定義はもはや、製品(「アイデア」や作られた「何か」)だけを定義するのではなく、プロセスを定義しています。
創造性の定義をアウトプットに焦点を当てることは批判され、代替案が提案されてきました。例えば、2023年に発表された論文で、Green、Beaty、Kenett、Kaufmanの各学者は、創造性がしばしば生み出されるものによって定義されることを書いています。彼らはこのアプローチの限界について書き、創造性は単なる一連の製品ではなく、現在の定義がしばしば無視または除外するプロセスであることを概説しています。彼らの論文では、「目標が実際に達成されるかどうか」に依存しない「創造性のプロセス定義」を開発しています。彼らは「創造性は生成的な目標によって制約された内的注意として定義される」と提案しています。
どの定義を好むかに関わらず、アウトプット中心とプロセス中心の両方の創造性の定義は、意図を持って取り組まなければならない活動を指しています。認知科学者であれば、異なる考えを持つでしょう。
創造性はすでに民主化されている
認知科学研究教授のMargaret Bodenは、1998年の論文「創造性と人工知能」で、創造性を日常的なタスクに必要な人間の知能の特徴として定義しています。
「創造性は特別な『才能』でもなければ、ごく少数のエリートに限定された心理的特性でもありません。むしろ、それは一般的な人間の知能の特徴です。それは、アイデアの関連付け、想起、知覚、類推的思考、構造化された問題空間の探索、反省的な自己批判などの日常的な能力に基づいています。認知的次元(新しいアイデアの生成)だけでなく、動機付けと感情も含み、文化的文脈と性格的要因と密接に関連しています。」
Boden教授の定義に基づけば、生成AI製品が創造性を民主化するという主張は全くのナンセンスです。なぜなら、創造性はすでに民主化されているからです。
上記をレビューすると、アイデアの生成と使用、新しいものや想像力豊かなものを作ること、目標を達成するために取り組むプロセス、人間の知能の特徴など、創造性のさまざまな定義のクラスターができました。では、AIは創造的でしょうか?この質問に非常に単純に答えたいなら、「それはどの創造性の定義を使用するかによる」と言えるでしょう。
プロンプトを受けた後、新しいアイデアを生成したり、新しいものを作ったりする活動は、ChatGPT、Bard、Stability、Anthropic、Fireflyなどの今日の生成AIツールの能力の範囲内にあると主張する人もいるかもしれません。これらは、何らかの方法で制約されながらアウトプットを生成するコード化されたプロセスを経ることができます。そのため、創造性の定義が「独創的で珍しいアイデアを生み出す能力、または何か新しいものや想像力豊かなものを作る能力」であれば、AIは創造的であると言えます。
しかし、ここで2つの重要な点を指摘する必要があります。
これらの製品は世界を経験していません。機能するために人間の介入を必要とします。「プロンプトを受けた後」が重要なフレーズです。また、隠れていますが確実に存在する膨大なデータセットがあり、人間が作成したメディアで構成されており、システムが機能するために必要不可欠です。AI製品によって生成されるアウトプットは、記録された人間の活動と介入によって動かされています。
2つ目の重要な点は、アウトプットは単に存在するからといって「創造的」とラベル付けされるわけではないということです。何かを「創造的」と呼ぶためには、誰かがそれを評価し、その判断を下す必要があります。
通常、定義は何かを説明するのに役立ちますが、受容基準は提供しません。何が良いか、悪いか、あるいは受け入れ可能かを判断するのに役立ちません。例えば、アイデアが新しいまたは想像力豊かではあるが悪い場合、それは創造的でしょうか?完全に拒否された場合はどうでしょうか?
創造性の時間的・文化的性質
1864年から1869年まで、画家ポール・セザンヌの作品はパリ・サロンによって毎年拒否されました。彼の作品は1876年から1879年まで再び拒否されました。1882年、パリ・サロンの審査委員会は、初めてそして唯一彼の作品を受け入れました。これは18年間の承認待ちの期間であり、その間、彼は他の場所で展示を行い、数人の批評家からの支持を得ました。パリ・サロンに拒否された年に描かれたセザンヌの「L'Assiette bleue」(1879年)は、2023年11月のサザビーズのオークションで607万9500米ドルで落札されました。セザンヌの作品、彼の創造性の表現が、かつては展示するに値しないと判断されたことを言うのは不条理に感じますが、歴史的事実に基づけば、それは真実です。この例を現代化し相対化するために、映画スタジオが新しいコメディを公開し、誰も笑わなかった場合、それは失敗した創造的な試みでしょうか、それとも創造的ではないと言うでしょうか?もしその作品が20年後にカルト的な人気作品になったらどうでしょうか?これらの追加の次元は、定義だけでは不十分な新しい領域に私たちを導きます。設定されている受容基準、受容基準の所有者、基準が生じる背景として機能し、作品が判断される広範な文脈が非常に重要です。これは創造性を定義することが非常に難しい別の理由を提供します。なぜなら、それに付与される時間的および文化的な性質があるからです。さらに言えば、美しさと同様に、創造性は見る者の目にあるだけでなく、社会的に定義され評価されると言えるでしょう。
プロセス中心の定義を使用してAIを創造的と定義しようとすることも問題があります。なぜなら、簡単に言えば、そのプロセスが何であるかわからないからです。「ChatGPTまたは類似のシステムを開いて内部を見ると、数百万の数字が毎秒数百回変動しているのが見えるだけです。そして、それが何を意味するのか全くわかりません」と、技術的AIの安全性に焦点を当てたAnthropicの研究部門を率いるAI科学者で、ニューヨーク大学の准教授でもあるSam Bowmanは述べています。MIT Technology Reviewで指摘されているように、「これは今日のAIブームの基礎技術であるディープラーニングについての注目すべき事実を浮き彫りにしています。その驚異的な成功にもかかわらず、それがどのように、またはなぜ機能するのか、誰も正確には知らないのです。」同じ記事で、カリフォルニア大学サンディエゴ校のコンピュータ科学者Mikhail Belkinは「明らかに、私たちは完全に無知ではありませんが、私たちの理論的分析は、これらのモデルができることとはかけ離れています。例えば、なぜ言語を学習できるのか?これは非常に神秘的だと思います」と述べています。
確かに神秘的です。創造性そのもののように。
機械的な物まね鳥
創造的であるというよりも、生成AIは単に創造性を模倣しているだけでしょうか?生成AI製品は創造的な機械というよりも、機械的な物まね鳥でしょうか?結局のところ、その名前が示すように、大規模言語モデル(LLM)は創造性ではなく言語をモデル化しています。しかし、言語が創造性の重要な要素を形成しているため、LLMは人間と同じように創造的なタスクを実行していると認識されています。
この質問に答えようとすると、ある事実がかなり早い段階で明らかになります。「AIは創造的か?」という質問に答えようとすることは、意味論的な結び目に自分自身を縛り付ける確実な方法です。これは擬人化が暴走したケースなのか、それとも技術ユートピア主義者が実際には存在しないより大きな力を技術に帰属させようとしているのでしょうか?私たちには両方を行ってきた歴史があります。擬人化は、人間以外の存在に人間の性質の存在を知覚する人間の能力です。この進化的反応は、世界を理解するのに役立ちますが、何が起こるか、または物事がどのように機能するかを予測する方法を教えるのにも重要な役割を果たしました。社会的相互作用に熟練した人間は、より生き残る可能性が高かったのです。誰を信頼して助けを求めることができるか、誰または何から離れるべきかを予測することは、生死に関わる問題でした。その結果、意図と主体性の兆候を見つけることは私たちにハードコーディングされており、私たちはこれらの兆候をどこでも見ます。他の人間だけでなく、雲、月、金魚、朝のカプチーノの泡、チャットボットなど、何も免れません。
私たちは実際には存在しないものを見ている可能性があります。
信念がトレンド、技術、お金と衝突する
19世紀、死亡率の高い流行病、高い子供の死亡率、2つの戦争(南北戦争と第一次世界大戦)が、新しく発明された媒体である写真と衝突しました。写真のコストが下がるにつれて、愛する人が亡くなった直後に写真を撮ることが一般的になりました。喪の肖像は死を記念する方法となり、重要なことに、家族や友人の記憶を保存する方法となりました。当時、1800年代から1900年代にかけて、カメラとそのアウトプットである写真は、魔法に最も近いものに感じられたに違いありません。この装置は現実のイメージを印刷することができたのです。この信念は、次に起こることにとって決定的でした。
ほぼ同じ時期に、スピリチュアリズム運動が広まり始めました。スピリチュアリストは、死者が生者とコミュニケーションを取ることができると信じており、この時期、心霊現象、幽霊の目撃、降霊会の報告が増加しました。この時期、霊界に入り、死者と直接つながることができる霊媒師と呼ばれる人々の数が増えていました。1861年、信念がトレンド、技術、お金と衝突しました。
宝石商の彫刻師だったWilliam H. Mumlerは、二重露光と呼ばれる技術を使用して別の人物を画像に含める方法を学びました。このプロセスは、2番目の人物を非常に微妙な方法で転写し、まさに写真の中の幽霊のように見えました。その画像は何らかの形で「The Herald of Progress」というスピリチュアル雑誌に掲載されました。まもなく、Mumlerは新しく発見した霊媒師としての能力を使って、心霊写真家として現金を稼いでいました。間もなく、心霊写真はスピリチュアリズムの証拠として使用されるようになりました。心霊写真と並んで、死者は他の技術を通じて現れ始め、話し始めました。心霊電信、心霊ラジオ、心霊タイプライター、心霊電話が、亡くなった人々とつながる能力を持つと報告されるようになりました。これらの技術を取り巻く誇大広告は非常に説得力があり、ニコラ・テスラとトーマス・エジソンは電磁気が超自然的な力を持つかどうかを試す実験を行いました。裕福で有名な人々でさえ、好奇心を抑えることができませんでした。作家のマーク・トウェイン、奴隷制廃止論者で政治家のフレデリック・ダグラス、そしてビクトリア女王(!)が降霊会に出席しました。
しかし、その後、疑念が忍び込み始めました。質問が始まり、方法が調査され、専門家が呼ばれました。懐疑論者は、二重露光技術の写真を精査し、降霊会のターンテーブルをワイヤーや滑車がないか調べ、専門家を呼び込むことで、誇大広告を切り裂き始めました。当時の超一流の奇術師ハリー・フーディーニは、詐欺的な霊媒師を暴くために雇われ、ハーバード大学とマサチューセッツ工科大学の学者で構成される委員会が組織され、あなたが呼び出すことができる超常現象が本物であると委員会を納得させることができれば、5,000米ドルの賞金が提供されました。Mumlerに関しては、彼の顧客の一人によって詐欺師であることがすぐに明らかになりました。クライアントのポートレートを撮影中、Mumlerは生きている男性の幽霊のようなイメージを重ねました。クライアントはMumlerの詐欺的な方法を暴露し、彼の評判は台無しになりました。
生成AIを創造的と表現することで、私たちは心霊写真2.0のケースを可能にしているのでしょうか?これはすべて、偶然にも数兆ドル規模の価値があるAIの目まぐるしい誇大広告の中で、私たちの注意を引くためのセクシーなスローガンを使用したマーケティングに過ぎないのでしょうか?1861年、信念がトレンド、技術、お金と衝突しました。それは今起こっていることとどう違うのでしょうか?
メタファー、比喩、質問の新しいライブラリ
AIと創造性のトピックにわたる調査を行うことは、さらに多くの質問を生み出す能力を持っており、おそらくそれが必要なのかもしれません。「AIは創造的か?」という質問は、この強力な技術が創造産業に与えている影響から注意をそらすもののように感じます。この技術の採用と実装をサポートするものではなく、むしろ恐怖を煽るものです。また、著作権に関する会話も進めません。(人間の)創造的作品が経済的富を生み出すために依存する法的基盤が論争の的になっているのであれば、その解決にエネルギーを向ける必要があります。
定義についてひたすら議論し、何時間も過ごすよりも、文法革命が必要だと感じます。人間を機械と直接比較する言語を使用する代わりに、人間と機械の創造的行為と活動をよりよく説明できるようになる必要があります。鳥と飛行機、または潜水艦とサメを比較しようとするのと同じくらい不条理に感じます。飛行機は鳥ではありませんが、確かに同じ空を飛びます。潜水艦は絶対にサメではありませんが、両方とも水中に潜り、海の深さを探検することができます。
人間の創造的な脳と計算創造性を同じように議論し続けることは、この技術が創造的活動に関連する人々やプロセスに与えている幅広い影響についての理解と行動を進めるものではありません。この分野の主要な思想家で、「Story Machines: How Computers have become Creative Writers」の著者であるRafael Pérez y Pérez教授とMike Sharpels教授は、言語と新しい定義を通じて人間と計算の創造的努力を区別しています。彼らは「計算創造性」を「コンピュータを反省と新しい知識の生成のための中核ツールとして使用する創造的プロセスの学際的研究」と定義しています。このようなより具体的な定義、異なるメタファー、比喩、新しい一連の質問は、機械と人間の交差点が成長し、より複雑になるにつれて私たちに役立つでしょう。
このプロセスを開始し、この記事を締めくくるために、生成AIの創造的行為とプロセスを考えるための新しいメタファーの提案があります。生成AIをツールと呼ぶのをやめて、代わりにメディアム(媒介)と呼び始めたらどうでしょうか?これがどのように見えるかを示します。
生成AI製品は21世紀の霊媒です。指示を通じて、テキスト、画像、音声を(霊的に)返すことができます。人間の霊媒と同様に、最初に見えるほど全能の存在ではありません。それらは過去に縛られており、その方法を疑うべきであり、提供するアウトプットは疑問視され、額面通りに受け取るべきではありません。返されたものをどうするか、またはそれをどのように解釈するかは、私たち次第です。