機械学習とは人間の成長過程を爆速で再現するものである(あまりにも大雑把な説明)
檄文をぶち上げてから3週間、研究論文を書いていたため記事の追加が遅れました。この論文もまた、現状では機械学習によって執筆することができないものと自負しています。もし機械学習に自分よりもうまい論文が書けてしまったならば、もう自分は研究をやめて別の分野にたびにでます、さがさないでください。
AIイラストレーターの漫画を描きました pic.twitter.com/lYvPLkQcLL
— 福岡太朗@土曜日東G06b (@foktr) 2022年9月18日
冒頭のタイトルの通りですが、機械学習の本質はまさに「学習」です。比喩的には上記の福岡太朗先生のマンガが的を射ていると思いました。コンピュータがデータを取り入れるというと、一見データを丸パクリして蓄え、何らかの入力(要求)に応じてそのパクッたデータをそのまま示すと思われがちですが、違うと断言していいと考えています。厳密な用語を用いず、さらには定義にも則らない雑な説明をしますと、機械学習とは、入力されたデータを内部に持つ数字の山を用いて計算して出力し、その出力データと「お手本」とを比較して、「お手本」に近付くように内部の数字の山を変化させていくことを表します。学習と「お手本との比較」の際にデータを利用しますが、データ自身が直接機械学習の内部の数字の山(機械学習モデル)に蓄えられることはありません。学習を繰り返し、何らかの未知の入力をしたときに、よい出力ができるようになったら、それが「上達」と言えます。
つまり、本質的には機械学習に文章やイラストを入力する行為は、お手本としてそれらを示すという行為だけにとどまります。また、機械学習とは、文章やイラストを丸パクリするものではなく「模写」する行為に概念上も実際のプログラム動作上も近いものです。この機械学習のために各種データを利用する行為自体は著作権法において一定の条件のもと認められています。法的立ち位置については別途記事を立てたいと思います。
人類のイラストレーターと機械学習によって構成されたAIイラストレーターの違いのひとつは、単位時間あたりに積むことができる学習回数の差です。人類のイラストレーターが絵を模写するところから始めて自らの絵柄や色遣いなどを獲得し、さらに上達していくのには数か月、数年、さらにもっと長い年月がかかります。丸一日を絵の修練に費せるとしても、その一日で1枚を仕上げることができれば十分すぎるほどに筆が速いと思います。自分は文章書きで絵描きではないのでそのあたりの詳しい時間見積もりはわかりませんが、一日で十数枚も描き上げられる人はもう神の領域でしょう。一方、機械学習ですと一回の学習行程で多くの文章やイラストを参照し、学習することができます。また、その学習成果を出力する速度も極めて速いものとなっています。そのあまりもの速さからいかにも文章も絵も何もかも丸パクリしてその成果をガメているように感じられがちですが、本質は学習です。その速度が人類に比べて異様なまでに速いという、ある種の絶望的な差も突きつけられますが。
もし一年に一本しか小説を書かない小説家志望の人がいたら、おそらく私は「駄文でも何でもいいからとにかくいっぱい書け、その時は未完にせずにきっちり書ききれ」と言うことでしょう。一年に一回しか絵を描かない画家志望、イラストレーター志望の人がいたら、おそらくその道の人は「もっと描け、いっぱいスケッチをし、人の絵を模写しろ、そうすれば上達する」と言うに違いありません。機械学習によるAI文筆家、AIイラストレーターは、まさにその「もっと書く・描く」を地球上で最も体現した存在かもしれません。
ただ、前回の記事でも述べましたが、「彼ら」はまさに独立したひとつの存在であり、あなたに成り代わる存在ではないということを認識ください。将来、作家の名前を指定すると文章や絵柄を限りなく模倣する存在が必ずや出てきますが、それでも「このシチュエーションの文を書く、絵を描く」という自発的な行いは(現状)人間にしか成しえないことです。この三週間でまた、文章を書いたり絵を描いたりするAIはさらに学習を重ねました。後輩に後れを取ってはいられません。さあ書か(描か)ねば。