「自動寿司握り機」の製造企業を「職を奪う」として寿司職人は提訴するか。

米国の主要メディアがOpenAIに抗議
 今年2月、米国の主要経済紙ウォーストリート・ジャーナルを発行するダウジョーンズ(米ニューズコープ傘下)が、ChatGPTの開発元である米OpenAIが正当な対価を支払うことなくウォールストリートジャーナルの記事を利用している、と抗議した。
 同社は「ウォールストリート・ジャーナルの記事をAIのトレーニング(機械学習)に利用したいと考える者は誰でも、そのための正当なライセンス(使用許諾権)をダウジョーンズから取得しなければならない」とする公式コメントを出した。
 一般にChatGPTのような生成AIはウェブ上からテキストや画像をはじめ様々なコンテンツを大量に収集して、これらから「機械学習」と呼ばれる手法で学ぶことによって、まるで人間が書いたかのような自然な文章を書いたり、玄人はだしの絵画やイラストなどの画像を描き出したりすることができる。
 ところが、こうした生成AIの機械学習に使われるコンテンツ(一般に「教師用データ」あるいは「学習用データ」などと呼ばれる)は無断で、つまり著作権者からの利用許諾を得ることなく勝手に収集されて使われている。ダウジョーンズはまさにこれを理由にOpenAIを非難しているのだ。
 米ブルームバーグ・ニュースの報道によれば、ダウジョーンズがOpenAIに抗議することになった直接のきっかけはある告発であったという。
 ジャーナリストのフランセスコ・マルコーニ氏がChatGPTに「貴方が自分のトレーニング(機械学習)に使っているニュース・ソースは何ですか?」と尋ねたところ、ChatGPTは前述のウォールストリート・ジャーナルやニューヨーク・タイムズ、CNNをはじめ計20の主要メディアを列挙したリストを表示した。
 このリストをマルコーニ氏が自らのツィッターで紹介して告発したところ、それがダウジョーンズ関係者の目にとまり、前述の抗議声明へとつながったようだ。
 もっともChatGPTはユーザーからの質問に対し、しばしば誤った情報を返したり、口から出まかせの嘘をついたりすることで知られるが、今回のように自らを不利な状況に追い込むために敢えて嘘をつく理由はない。
 つまりChatGPTが実際に、それら主要20メディアの記事などを自らの機械学習のために利用している可能性は十分ある。
 このため(米ワーナー・ブラザース・ディスカバリー傘下の)ケーブル放送局CNNも、ChatGPTが同社のコンテンツを(機械学習用に)無断で使っている、と抗議している。同じくブルームバーグ・ニュースによれば、CNNはOpenAIに対しライセンス料(コンテンツ使用料)の支払いを求めて交渉する計画であるという。
 ただ、昨今、米国のビッグテックが勢いを失い、IT関連のトピックも乏しくなる中、突如彗星のように現れたChatGPTの報道によって、CNNやウォーストリート・ジャーナルなど主要メディアは相当高い視聴率やページビューを記録したはずだ。
 それによって多額のお金を儲けたと思われるが、その功労者であるOpenAIに対して、さらにお金を請求するとなれば、大人気ないと言われても仕方がないだろう。
 もっとも、これは、本来そういう問題ではない。主要メディアはOpenAIに対し「自分たちのコンテンツをAIの機械学習に使いたいなら、その著作権料を支払うべきだ」と主張したいのだろう。
 従来の常識から考えて、ChatGPTが出力する何らかのテキストがオリジナル作品のコピーでない限り著作権侵害には当たらないはずだが、「機械学習の教材」というケースは過去に前例がないだけに、主要メディアとしては「とりあえず自分たちの権利を主張してみよう」というところかもしれない。
 しかし、ChatGPTのようなAIに自分たちのコンテンツを勝手に使われた挙句、本来なら検索エンジンから自身のサイトへと流れ込むはずのトラフィック(ページ・ビュー)や可処分時間も奪われる可能性があるので、実は新聞社などメディアにとって死活問題なのである(これはメディアに限った話ではないが)。いずれはAIで動画も生成可能となるので、ハリウッドのような映画産業やテレビ局等も同様に神経を尖らせてくるだろう。
 ダウジョーンズ関係者やCNN等の発言に対し、OpenAIはこれまでのところ公式のコメントを出していないが、素直に相手の要求に従って権利料を支払うようなことはまずあるまい。となると今後、主要メディアとOpenAIとの法廷闘争につながる可能性も無きにしも非ずだろう。

漫画家やイラストレーターが画像生成AIを訴える

 実際、他の生成AIでは既に訴訟が起きている。
 今年1月、米国で画像生成AIに対する集団訴訟が起こされた。その原告は、米国の漫画家、コンセプト・アーティスト、イラストレーターら3名を代表とするクリエーター(アーティスト)たちだ。
 一方、被告は世界的に使われている画像生成AI「Stable Diffusion」や「Dream Studio」の開発・提供元である英Stability AI、同じく世界的な画像生成AI「Midjourney」の開発・提供元である米Midjourney(製品名と組織名が同じ)をはじめ全部で3つの団体だ。
 原告側の訴えによれば、Stable Diffusionのような画像生成AI(の開発提供元)は数百万人に上るクリエーターが創作した数十億枚にも上るイラストや絵画、漫画などの画像を無断で収集し、そうしたAIのトレーニング(機械学習)に使っている。
 これはクリエーターの著作権を侵害すると同時に、アート市場における新たな競合関係を生み出し、各種アーティスト(つまり人間)を市場から締め出している。実際、それは既に目に見える形で表れているという。
 Stable Diffusionのような画像生成AIでは、ユーザーが実在するクリエーターの描画スタイルを指定して画像を生成させることができる。
 たとえばイラストレーター(Aさん)の名前を挙げて、「Aさんの描画スタイルに従って、これこれこういう絵柄のイラストを作成してください」というリクエストを出すと、画像生成AIはまさにAさんが描いたかのようなイラストを描き出して出力する。これは一般に無料で行われる。
 このため、過去にAさんに雑誌、書籍の挿絵やゲーム・ソフトのイラストなどの仕事を依頼していた出版社やゲーム・メーカーなどが、最近はそうした画像生成AIを使って、タダでAさんそっくりのイラストを製作してしまうようになった。
 これと同じようなことは多かれ少なかれ、漫画家やデザイナー、コンセプト・アーティストなど他の職種でも起きている。
 結果、これらのクリエーターに出版社やゲーム会社、新聞社、映画スタジオなどから舞い込む仕事が以前に比べて目立って減少している、という。しかも元はと言えば、自分たちが創り出した作品から学んだAIに仕事を奪われていることになる。これはどうにも我慢できない、というのが訴訟の主な理由だ。

AIの画像生成プロセスが争点に

 この訴訟は現在、ペンディング状態にある。しかし事の重大さから判断して、近いうちに米国の司法当局に訴えが受理され、実際に裁判が始まるのは間違いない、と見られている。
 この裁判で原告のクリエーターたちは、Stable DiffusionやMidjourneyのような画像生成AIの廃止を求めるのではなく、むしろこれらAIが稼ぎ出す収益から各種アーティストに対し正当な対価が支払されるようなシステムの構築を求めていくのではないか、と見られている。
 仮に、裁判が始まった場合、その主な争点となるのは、画像生成AIが実際に絵画やイラスト等の画像を生成するプロセスだ。
 原告のクリエーターらによれば、「画像生成AIは実際には各種アーティストが描き出したイラストや漫画などの画像を無断で複製し、それらをコラージュ、つまり組み合わせているに過ぎない」という。つまり本質的にはオリジナル画像の単なるコピーに過ぎないので、これは明らかに著作権の侵害に当たる、というわけだ。
 実際、画像生成AIが出力した一部の画像には、画家らアーティストによる署名のようなものがぼんやりと残っていたりする。これがまさに「コピー」の証拠である、という。
 こうした原告側の訴えを、Stability AIをはじめとする生成AI業者らは真っ向から否定している。
 それによれば、画像生成AIが実際にやっていることは、「Dimension reduction(次元削減)」や「Diffusion model(拡散モデル)」など情報科学や物理学の先端理論に従って、「Latent space(潜在空間)」と呼ばれる数学的な空間上で「AI独自の描画スタイル」を導き出すことだ、という。
 この独自の描画スタイルに従って全く新しい画像を創出しているので、画像生成AIはアーティストの著作権を侵害していることにはならない、というのだ。
 「しかし、そんな難しくて高尚なことを言っても、AIが生成した一部の画像にアーティストの署名らしきものが残されているのはどういうわけだ? これらは所詮、オリジナル画像のコピーに過ぎないのではないか?」とアーティスト側が反論するなど、裁判が始まる前から議論は紛糾している。

コード生成AIも集団訴訟のターゲットに

 こうした激しい争いの陰に隠れて目立たないが、実はコンピュータ・プログラムを生成するAIに対しても昨年11月に米国で訴訟が起こされている。その標的となったのは、あのChatGPTを開発した米国の研究機関OpenAIや、これと提携する米マイクロソフトなどだ。
 対話型のAIであるChatGPTのベースとなっているのは、2020年にOpenAIが開発した大規模言語モデルの「GPT-3」である。本来、小説や論文、新聞記事のようなテキスト・コンテンツを生成するはずのGPT-3だが、実際に研究者がこれを使ってみると、驚くべきことにコンピュータ・プログラム、つまり「コード」まで生成し始めた。
 この理由は、OpenAIの研究者らがGPT-3の機械学習用データとしてウェブ上から搔き集めた膨大な文献の中に、たまたま大量のコンピュータ・プログラムも含まれていたためだ。
 GPT3のようなAIにとって、新聞記事のようなテキスト(文章)もコンピュータ・プログラムのようなコードも所詮「文字列」という点では同じだ。これらを機械学習したGPT-3は、結果的にテキストのみならずコードも自動生成し始めたのである。
 これを見たOpenAIの研究者らは、新しい生成AIのテンプレートに大量のコンピュータ・プログラムだけを読み込ませて、それを機械学習させることでコード生成に特化したAIを開発した。これが「Copilot」と呼ばれるコード生成AIである。
 Copilotの機械学習に使われたのは、マイクロソフトの傘下にあるオンラインの開発者コミュニティ「GitHub」が共有している大量のコンピュータ・プログラムだ。GitHubには、世界中のプログラマーから寄せられた大量のコードがオープン・ソースとして公開されている。
 このオープン・ソースとは「誰でも自由に使えるコード」のことだ。従って生成AIの機械学習に使っても構わない、とOpenAIの研究者らは考えたのだろう。このようにして開発されたCopilotは、今では世界中のプログラマーの間で使われている。
 このツールを使うと、ソフトウエア開発者がプログラムの発端となるコード(文字列)を入力するだけで、ちょうどオート・コンプリートのような形で続きのコードが次々と生成される。
 もちろん誤ったコードが出力されるときもあるので、最終的には開発者によるチェックと修正が必要になる。が、それでもプログラミングの生産性を少なくとも10パーセント程度向上させることができる、と開発者の間で高く評価されている。
 他方で、Copilotのようなコード生成AIがいずれはプログラマー、つまり人間の仕事を奪うのではないか、と危険視する向きもある。
 本来、プログラマーが共同研究や自らの腕を上げるために活用するはずだったオープン・ソース・コードがいつの間にかAIの機械学習に使われ、それがプログラマーの職を奪うようでは元も子もない。
 つまり「コード生成AIはソフト開発者の権利を侵害している」との理由で、一部のプログラマーや弁護士らが、OpenAIとマイクロソフト、GitHubの3者を相手取って前述の集団訴訟を起こしたのだ。
 こう見てくると、今、世界的な脚光を浴びているChatGPTのような生成AIは、その陰で法的な危険地帯を忍び足で歩いていることが分かる。
 今後、順調に成長すれば途方もないビジネス上の富を生み出すと期待される生成AIだが、産業各界による活用と並行して司法当局による妥当かつ適切な判断、いずれは立法府による新たな法的枠組みの整備等も求められることになりそうだ>(以上「現代ビジネス」より引用)



 
「ChatGPT」開発元が集団訴訟の標的に…「生成AI」はメディアやクリエイターの権利を侵害しているのか?」と題する小林雅一氏(作家・ジャーナリスト)の論評を読んで暗澹たる気分になった。「ChatGPT」開発元を訴訟した段階でヒトがAIに負けたと認めたことになりはしないだろうか。
 たとえば「自動握り寿司製造機」を製造した業者を握り寿司職人が提訴しただろうか。回転寿司を安価にお客に提供するには熟練した寿司職人が握っていては間に合わないし、安価な価格で握り寿司を提供することも出来ない。従って、回転寿司を利用する人たちは機械が握っていることを承知の上で利用している。

 試しにchatGPTをインストールしてAIを利用してみたが、ヒトに取って代わるほどの能力を有していないと解った。確かに作文能力と情報収集能力はヒトを超えている。しかしAIが収集する情報は検索エンジンが収集したデータ内に限定されている。
 試しにあなたの名前をAIで検索してみると良い。あなたが有名人でない限り、AIは一行も書けない。それはあなたに関するデータがその検索エンジン内に蓄積されてないからだ。

 ということは新規の研究論文もAIには書けない、ということだ。その反対に、既に研究された事柄に関しての論文なら、AIはお手の物で瞬時にしてアウトプットするだろう。それなら反対に研究者が研究する方向性を確認するのにAIが利用できる。
 つまりAIが簡単に研究成果を書き出すようなら、その研究は既に誰かによって成し遂げられたものだ、と確認できるし、たとえ研究成果が論文として書き出されたとしても、その内容が自身が究明しようとするものと異なるのであれば、勇気をもって研究に励むことだ。

 chatGPTがMS(マイクロ・ソフト)社によって開発されたものだから、EDGエンジンによって収集された情報量はgoogleの検索エンジンによって収集された情報量の足元にも及ばない。恐らくMS社が収集している情報量はgoogleが収集しているものの1/10以下ではないだろうか。
 AIが本来の輝きを持つのはgoogleがAIアプリを発表してからだろう。googleが収集しているデータこそビッグ・データと呼ぶにふさわしい。そうすると研究者たちにも利用価値が出て来るだろう。AIで生成される論文は既に研究された分野のものでしかない、と反証されるからだ。

 引用論評では「漫画家やイラストレーターが画像生成AIを訴え」ているという。今後は「コード生成AIも集団訴訟のターゲットに」なるという。だが、それは漫画家やイラストレーターたちの敗北宣言ではないだろうか。寿司職人が「自動寿司握り機」の製造企業を提訴するのと何処が異なるというのだろうか。
 画像生成AIは実に素晴らしい、と私は感じる。漫画家が書いた主人公などをストーリー通りにトレースするために多くの漫画家やイラストレーターを雇用し、長時間拘束する「業界構造」が大きく変化する。それは蒸気機関が人力作業を奪った18世紀の産業革命に等しい。
 「コード生成AIも集団訴訟のターゲットに」とあるが、現職のSEやプログラマーで既存のコードをコピペしていない者はおそらく皆無だろう。恐ろしく多いコードの決まりを覚え、複雑な作業手順を覚えてコードを書き込みプログラムを作成するのは大変な労力だ。しかし先人が書いたものがあれば、それをコピペしてはめ込み利用すれば手軽に済む。それと「コード生成AI」の作業手順とどれほど異なるというのだろうか。

 かつてスパコン競争で米国がソニーのゲーム機を大量に繋げて、トップクラスの成績を獲得して世界を驚かせたことがある。5000個以上のゲーム機を繋げて、大量の電気で動かせばスパコン競争ですら何とかなる。
 googleの検索サーバーに蓄積されたビッグ・データにアクセスしてAIが生成すれば、殆ど出来ない分野などないだろう。高層建築の設計図だって、瞬時に作成できるに違いない。複雑怪奇な耐震計算や構造計算なども瞬時にして完了させるだろう。しかし設計者がAIを「集団提訴」することは恐らくないだろう。なぜならAIを駆使して高層建築の設計をした方が、むしろ安心だからだ。人が設計してミスを何処かでしていないかを検査する方が莫大な労力を費やすだろう。しかしAIが生成した建築物設計に独創性や斬新さは求めるべくもないのは云うまでもない。

 AIは人知を超えるか、という命題がある。私は決してAIは人知を超えるものではない、と考える。確かに一定の条件下で勝負を競う囲碁・将棋やチェスなどの世界ではAIの強さはヒトを上回っている。だが、それは到達点と条件がすべて揃ったゲームの世界での話だ。
 到達点も「一定の条件」もない研究や創造の世界で、AIが人知を上回ることは永遠にあり得ない。なぜならヒトはAIを作成した創造主だからだ。

このブログの人気の投稿

それでも「レジ袋追放」は必要か。

麻生財務相のバカさ加減。

無能・無策の安倍氏よ、退陣すべきではないか。

経団連の親中派は日本を滅ぼす売国奴だ。

福一原発をスーツで訪れた安倍氏の非常識。

全国知事会を欠席した知事は

安倍氏は新型コロナウィルスの何を「隠蔽」しているのか。

自殺した担当者の遺言(破棄したはずの改竄前の公文書)が出て来たゾ。

安倍ヨイショの亡国評論家たち。