近年のAIの進歩は目覚ましいものがあり、私たちの日常生活においてなくてはならないものとなりました。特に、2022年末に登場したOpenAIのChatGPTは、それ以前に存在したチャットボットの性能を大きく上回るものであり、有用性が高く評価される一方で、その利用をめぐって様々な議論を巻き起こしています。
2023年12月14日にNatureに掲載された論文は、数学の「組合せ論」という分野における重要な問題をDeepMind社のAIが解いたことを報告しています(1)。この記事では、まずこうしたAIの「中身」は一体どうなっているのかについて触れ、この研究で解かれた数学問題を簡単に説明し、最後にこの研究の何が画期的であったのかをお伝えします。
大規模言語モデル(LLM)とは
ここ最近、「生成AI」という言葉が世間を賑わせています。生成AIとは、人間の入力に対してコンピュータが学習データをもとに、新しいデータを出力する技術のことを指します。出力されるデータは多岐にわたり、文章のみならず画像や動画を出力する生成AIも存在しています。OpenAI社のChatGPT、Google社のBardなどは、生成AIの代表格であり、文章の生成に特化しています。そして、このような文章生成に特化した生成AIを裏で支えている技術、すなわちその「中身」は、「大規模言語モデル(Large Language Model; LLM)」と呼ばれるものです。
LLMを含む「言語モデル」では、投げかけられた質問に対して事前に与えられたテキストデータの学習・分析を通じて「あり得そうな回答」を出力します。例えば、「ライオンは何科?」という質問に対して、テキストデータを参照し「ライオンはネコ科」や「ライオンはイヌ科」といったテキストを探して、それぞれの出現確率を求めます。そうすると、「ライオンは」に続く文字が「ネコ科」となる確率が高いことから、正しく「ネコ科」であると回答することができます。
LLMでは、より膨大なテキストデータの学習が可能になったことと、ニューラルネットワークの発達による文脈の理解が進んだことで、より正確な言語処理が実現されました。このおかげで生成AIは、複雑で専門性の高い質問にも答えることができるのです。また、複雑な数学表現を理解したり、多段階の推論ができるため、数学的な問題を解決することも可能になりました。
カードゲーム「Set」とは
さて、頭を切り替えて、本研究で取り上げられたカードゲームについて紹介しましょう。このゲームは日本ではかなりマイナーですが、アメリカでは広く一般の人々に親しまれています。そのルールはシンプルで、広く楽しまれているバージョンでは、使用するカードには楕円・曲線・ひし形のいずれか1種類の図形が描かれています。そして、その図形はカードによって1個・2個・3個のいずれかであり、図形の色は赤・紫・緑のいずれか、図形の塗り方は、塗りつぶし(濃)・塗りつぶし(薄)・外枠だけのいずれかです。つまり、1枚のカードごとに、図形の形・数・色・塗り方という4つの要素が異なっています。
そして、それぞれに描かれている図形の形・数・色がすべて同じもしくはすべて異なる3枚のカードの組合せを「Set」と呼びます。
このゲームは、プレイヤーとディーラーから成り立ちます。ディーラーは、カードをよくシャッフルし、12枚のカードを場に置きます。プレイヤーは、カードが置かれた瞬間から「Set」となる3枚のカードを探し、見つけた瞬間に「Set」と声に出して3枚のカードをすぐさま回収しなければなりません。すなわち早い者勝ちのゲームです。「Set」を見つけたプレイヤーは1点を獲得し、その3枚のカードを捨て、ディーラーは新たに3枚のカードを場に加えます。この操作を山札がなくなるまで繰り返し、最後に獲得した点数が最も大きい人が勝ちです(3)。
「Set」が揃わない最大のカード数は何枚?
さて、研究の対象は「Set」の勝敗ではなく、数学の問題です。「Set」のルールでは、基本的には場に12枚のカードがあり、そこから「Set」となる組みを探します。もし、場に「Set」が存在しなかった場合は、ディーラーが山札から3枚のカードを追加して、場のカードは合計で15枚になります。それでも「Set」が存在しないのであれば、山札がある限りディーラーは場に3枚ずつカードを出し続けることになります。もちろん、場のカードが多ければ多いほど、そこに「Set」が存在する確率は高くなります。では、「Set」が”存在しない”ような場のカードの数の上限(これを「キャップセット」と呼びます)は何枚なのでしょうか?
このように最大の「キャップセット」を見つける問題は、数学の分野で「キャップセット問題」として取り扱われています。
カードゲーム「Set」のように、各カードに図形の形・数・色・塗り方という4つの要素がある場合には、キャップセットは20枚であるということが1971年に示されています。つまり、20枚であれば「Set」の組が存在しない可能性があるものの、21枚であれば確実に「Set」の組が存在する、ということです。もし、各カードに与えられた要素が4つではなく任意の整数nであった場合、キャップセットは何枚になるのでしょうか?
LLMで「キャップセット問題」を解く!解いた過程も見てわかる!
DeepMind社のAIは、FunSearchという手法を使って、上述のキャップセットを見つける問題を一般化した数学の問題において、n = 8の場合に大きさが512のキャップセットが存在することを示しました。従来の手法により導かれた最大の値が496であったため、それよりも16枚多いキャップセットを見つけたということになります。余談になりますが、n = 3 〜 7であれば、過去の最適な使ってもFunSearchを使ってもキャップセットは全く同じ値になります。n = 8という莫大な集合を扱わなければならない問題において、従来手法の解である496という値が本研究によって512へと更新されたことは素晴らしい結果です。しかしながら、本研究の最も画期的な点は、導かれた新たな解よりもむしろ、その解を導いたFunSearchという手法にあります。FunSearchは、組合せ論の問題を解くために特別に訓練されたLLMに対し、その解を導くプログラムを書くように要求し、さらにそのプログラムが他のものよりもすぐれているかどうかを迅速にチェックすることができます。
そして注目すべきは、LLMによって生成されたプログラムを私たち人間が目で見て確認し、理解することができるという点です。数学等の難問に対してAIを用いる場合、機械の中で何が行われているのかが人間には全く分からない状態で解が導かれることが議論の的となっていました。問題を解く過程がわからないにもかかわらず答えが得られるのは、はたして科学のあり方として適切なのか、ということです。FunSearchは、実際に問題が解かれる過程がプログラムとして表示されるので、この「ブラックボックス化」問題を解決することができるのです(1,3)。
おわりに
AIのすさまじい進化に伴い、人間の専売特許であった「創造性」がAIにも備わろうとしています。しかし、こうした事例は人間にとって脅威であるどころか、むしろ恩恵であると言えるでしょう。人間の頭脳だけでは解くことの難しかった問題が、AIと協力することによって解き明かせるようになる時代が来ています。今回取り上げたように、数学の世界にはまだまだ難問がたくさん転がっています。こうした問題が人間とAIのコラボレーションによってすべて解かれる日もそう遠くないのかもしれません。
この記事の作成・編集