知能と技術的特異点

はじめに

本アドベントカレンダーは25日間をかけて、知能、あるいは人工知能（あとで触れますが、正確には汎用人工知能を指す）について、それを理解しまた実現する技術について、広く浅く解説と紹介をします。

ここでいう人工知能は、後述するように一般に考えられている人工知能(Artificial Intelligence) ではなく、汎用人工知能 (Artificial General Intelligence, AGI) であり、一言で表すなら、「人と同じような知性をもった機械」を考えます。ただし、以降は特に断りのない限り、AGIの意味で単にAIといいます。AIとAGIの違いについては、以前の記事
人工知能は Deep Learning によって成されるのか？ - Sideswipe を御覧ください。こちらは今回のシリーズで扱う内容の概要としてもお使いいただけます。

知能とはなにか

知能は、一般に、抽象的思考、理解、自己の認識、他者とのコミュニケーション、学習、計画、記憶、創造と問題解決ができること、などによって定義されます。

人工知能とはなにか

人工知能は、その字面のとおり、知能（を持つなにか）を人の手で作ろうという試みです。
ここでの人工知能は、"真の"人工知能（強いAI ≒ AGI）であることに注意してください。逆に言えば、弱いAIは既に十分に実用化されています。
たとえば、

チェスをする
顔認識をする
線形代数や微分積分の複雑な計算をおこなう
クイズに答える
文字や声を認識する

などといったことは、すでにコンピュータ≒電子計算機（や階差機関）によってなされていますし、人間を超えたパフォーマンスを発揮しているものも多くあります。

人工知能の壁

5歳児にも勝てないチェスロボット？

では、こうした数々の輝かしい実績があるのにもかかわらず、なぜ人工知能を取り扱うのでしょうか？
それは、既存のAIでは決定的にできていない、できない壁が存在するためです。

チェスを例にしましょう。今のチェスプログラムは極めて賢く、1997年には世界チャンピオンのガルリ・カスパロフにIBMのディープブルーが勝利しており、人間はどんなに賢い人でもまず勝てません。ところが、チェスのコマを並べたり、持ち上げて移動させたりするのは極めて困難です。5歳の子供でも勝つことができるでしょう *1。

最新のロボット工学では、確かに様々なことが出来るようになりました。たとえばASIMOはお盆にお茶を入れて運び、人に渡すことができます。
このために多くの技術者が長い期間をかけてプログラミングを行いましたが、別のことをしようと思ったら（たとえば回収したコップを流しに入れるなど）また新しいプロジェクトが必要になります。

ディープブルーも、チェスでは無類の強さを誇る一方で、将棋はまったくできませんし、他のいかなる問題もできません。人間ならあるひとつのタスクからほかにつながるような一般化ができますが、そのような能力は既存のAIにはありません。

f:id:kazoo04:20151130200328p:plain
IBMのチェスマシン Deep Blue*2 と当時チェスの世界チャンピオンだったガルリ・カスパロフ(Гарри Кимович Каспаров, Garry Kimovich Kasparov) *3

ネズミにも勝てない災害救助ロボット？

もうひとつ例をあげましょう。
DARPA Robotics Challenge は、二足歩行ロボットで災害救助（を想定した競技）を行う大会です。
ここでは、自動車を所定の場所まで運転し、降車し、ドアノブをあけたり、ドリルをもって穴を開けたり、瓦礫の上を歩いたりしなければなりません。

The 2015 DARPA Robotics Challenge Finals - YouTube

このためには、極めて優れたエンジニアが長い期間をかけてプログラミングを行う必要があります。たとえば「ドアノブを開ける」というタスクについて考えましょう。
それには以下の様な手順でプログラムを書く必要があります。

3Dスキャナー（レーダー）でドアノブがありそうな場所の三次元形状を推定する
推定した形状をもとに、最もドアノブに似ている形状のものを探す
ドアノブの向きを調べて、つかむために必要な手首の角度を計算する
自身の位置とレーダーの情報を元に、肩からドアノブまでの位置関係を計算する
以上の結果から、肩・肘・手首・指をどのように動かせばドアノブまで手を伸ばせるかを計算する
モーターを駆動させる
様々なノイズによって各関節の位置に誤差が出るので、それらを検知する
誤差を打ち消すために必要な動きを計算して、フィードバック制御する
手になにがかぶつかったらそこで動きを止める
レーダー情報を解析して、手にぶつかっているものが確かにドアノブだと判定したら、手を握る
etc.

ここまででようやく「ドアノブを握る」まで到達しました。もう書ききれませんがこれだけの処理を人が作りこんでいく（=プログラミングをする）必要があります。今回はドアノブがレバーのようなタイプでも、丸いタイプだったらまた修正が必要です。ボタンを押して開く自動ドアだったらまた修正が必要です。気が滅入りますね。

A Celebration of Risk (a.k.a., Robots Take a Spill)
失敗事例集。最先端の技術を結集しても簡単に転んでしまう。

今の人工知能と我々はなにが違うのか

先日、私の1歳半の息子がクリスマスツリーの飾りが落ちているのを見つけて拾い上げていました。わたしが「もとのところに戻しておいて」と言うと、彼は迷うこと無くクリスマスツリーがあるところにいって適当な枝に飾りをひっかけていました。これは今のロボット工学からすると驚異的な能力です。本来別のところにあるものが落ちていることを認識し、拾い上げ、私の発言から意図を推測し、手に持っているものがクリスマスツリーの一部であることからツリーがどこにあるか思い出し、移動し、適当な場所に設置するだなんて、現在はどんなに賢いロボットでもできません。そもそも障害物だらけの場所をあんなに滑らかに歩行することがまず無理です。

「どうも今のロボットがとってるアプローチは、我々動物とは違うようだぞ？」と思っていただければそれで構いません。人間でなくても、たとえばネズミであっても段差を登っていって迷路を探索してボタンを押して餌をとる、なんてことはあっという間にできますし、一度学習したらちょっとくらい環境が変わってもなんなくこなせます。

そもそも、「不安定な場所を歩いて行き、転倒してもすぐに立てる」レベルのロボットは、最近ようやく Boston Dynamics の Big Dog ができるようになりましたが、こんなものは人間はもちろん、昆虫ですらできるわけです。どうにも今のロボットと動物は、物事の処理の仕方が決定的に違いそうです。

f:id:kazoo04:20151130203058p:plain
現代科学を駆使した最高の技術を結集して作ったロボットも、生まれたばかりの赤ん坊にあっという間に追いぬかれてしまうのはなぜなのか？

従来の人工知能は、ある目的に超特化してそれをうまくすることはできるのですが、動物の知能というものは非常に一般化されていて、どのような状況にも柔軟に対応できるということがわかります。

汎用人工知能

というわけで、今、世間で言われている人工知能は生き物にとって高度だと思われていること（微分積分の計算をする、チェスや将棋をする、etc.）に対しては高いパフォーマンスを発揮している一方で、生き物が簡単な問題（歩く、転がってきたボールを拾う、餌を探す、捕食者から逃げる、会話する、etc.）はまったく歯がたたないという、ある種のパラドックスが発生しているわけです。

そこで、従来の特化型の人工知能とはまったく別のアプローチをとって、動物の知能を模倣しようとする潮流があります。それが汎用人工知能(AGI)と呼ばれるものです*4。

どのようにしてAGIを実現するのかはまだあまりわかっておらず、当然AGIはこの世にまだ存在しないわけですが、わかりやすく言えば、映画に出てくる「人工知能をもったロボット」を想像していただければわかりやすいでしょう。たとえば、ドラえもん、鉄腕アトム、ターミネーターのT800, 2001年宇宙の旅のHAL9000, インターステラーのTARSとCARS, WALL・Eのウォーリーなどなど…枚挙にいとまがありませんが、それだけ人々が人工知能に対してさまざまな感情を抱いてきたことがわかります。

こういった"本物の"人工知能を作るのが汎用人工知能であり、また本稿の主題でもあります。

技術的特異点

技術的特異点(Technological Singularity) はキャッチーなのでタイトルに入れましたが、特にこのテーマを主眼に置いて記事は書きません。
技術的特異点は、人間と同等以上のAGIが生まれたときに、そのAGIがさらに洗練されたAGIを自ら設計し、そうして生まれたAGIがさらに洗練されたAGIを設計し…というプロセスがひとたび始まると、知能が爆発的に上昇し、人間が置いて行かれるようになるある瞬間のことをいいます。
もっとも、技術的特異点が発生するための条件として、AGIが存在するわけですから、本シリーズは「技術的特異点を起こす方法」とみなしてもよいでしょう。

f:id:kazoo04:20151130204802p:plain
技術的特異点を説明した図(正確なものではなく、あくまでも特異点が意味するところを想像してもらうためのイメージ)。人工知能が次第に賢くなっていくといつか人間を超える瞬間があり、それ以降は人工知能が加速的に賢くなる知能の爆発が起きる、といわれている。時間軸の「2015年」は便宜上設けたものであり、縦軸横軸ともに正確な意味はない。横軸の始まりの部分は、（人類誕生ではなく）生命が知性を獲得した瞬間、と考えていただきたい*5。

本シリーズの流れ

AI(繰り返しますが、以降はAGIの意味で人工知能あるいはAIと言います)の説明をしていくうえで、まずは「どうすれば人工知能が作れるか？」を考えましょう。
大きく分けると、ふたつのアプローチがあります(詳しくは人工知能は Deep Learning によって成されるのか？ - Sideswipe を御覧ください)。

ひとつは、トップダウンのアプローチです。つまり、数学の問題を解く、音声認識をする、顔認識をする、チェスをする、会話をする、などといった知能がもたらす高度な振る舞いをひとつひとつ観察・模倣していって、網羅的に知能的な振る舞いを実現していく方法です。これに従うならば、人間ができることをひとつひとつ丁寧にプログラミングによって再現していくことで、いつか人間と見分けがつかないような振る舞いをするロボットが作れる、というわけです。

もうひとつは、ボトムアップのアプローチです。脳は様々な部位から構成されており、またそれぞれの部位はさらに細かい神経の集まりによって構成されており、神経の集まりの中を見るとさまざまな神経細胞が複雑に繋がっており、さらには各神経細胞は化学的・電気的なふるまいによって動いています。これらを生理学的に調べていき、コンピュータ上に再現すれば、（十分にうまく再現できれば）知的な振る舞いをするプログラムが作れるはずです。

前者はすでに様々な分野で成果を上げている一方で、後者は考えただけでも気が滅入りそうです。そのため注目を集めやすいのはやはり前者のトップダウン的なものですが、モラベックのパラドックスといって、高度な知性が必要な物は簡単なのに、昆虫や爬虫類でもできるような振る舞いは難しい（つまりチェスのAIはすぐできたが、森を歩きまわるロボットは極めて難しい）という問題もあるので、ボトムアップ的なアプローチも必須だと考えられています。

もちろん、その中間くらいの部分からのアプローチも有効でしょう。

f:id:kazoo04:20151008201638p:plain

人工知能を実現する2つのアプローチ。知能がなす高度な振る舞いの模倣から始める(トップダウン)か、生き物が共通して持っている神経基盤を明らかにしていくか（ボトムアップ）が考えられる。実際にはこの2つの協力・融合が必要になる。

そこで、本シリーズでは、まずボトムアップで、つまり個々の神経細胞の振る舞いや、脳の各部位がどのような機能を持っているのかについて見ていきます。次に中間的なアプローチ、つまり心理学などによって動物の振る舞いから得られたデータを元に推測される脳の仕組みについてご紹介します。
最後にトップダウンのアプローチによって、機械学習（みなさんがお好きなDeep Learningも！）やコンピュータによる脳の各機能のシミュレーションについて触れます。

本シリーズで気をつけること

生理学に近づき過ぎない

今回は、AGIという題材を扱うことから、当然脳の仕組みについて触れますが、適度な粒度で扱うことにし、細部については省略します。
これは、文量が多くなりすぎて25日ではとても扱いきれないという点もありますが、必要以上に細かいところを見てもAGIの実現という目的からは逸れてしまうと考えるからです。プログラミング言語を作るときにトランジスタの電子の流れを説明することがないように、グライダーを作るときに鳥の羽毛の構造を勉強することがないよう*6に、今回もあまりにも細かい部分、たとえばニューロンが発火するときのナトリウムイオンの挙動については触れません。

（旧来の）人工知能には触れない

Support Vector Machine （サポートベクタマシン）や、Random Forest（ランダムフォレスト）、またDeep Learning（ディープラーニング）などの機械学習アルゴリズムや、ゲームのAI、車の自動運転技術などには触れません*7。これは一般にAIと呼ばれる分野ですが、すでに述べたようにこれらは人間の知性をコンピュータに再現するという汎用人工知能とは異なる技術です。今よく言われているAIと、AGIがかなり違うものだということはここまで読んだみなさんならよくお分かりかと思いますが、本シリーズをすべて読んでも、チェスをするソフトウェアや、二足歩行ロボットが作れるわけではありません。

クオリアに触れない

今回はクオリアには触れません*8。知りたい人はインターネットで検索してください。

機械論を前提にする

ここでは、脳は完全に物理法則の範囲内で動作しており、意識や心も今はわかっていないだけでいつかは理論的に説明可能であるという前提で説明します*9。
つまり、「科学では絶対に説明不可能な存在（たとえば霊魂）が存在して、それが肉体に働きかけることで我々に意識や心が生まれ、身体を動かすのだ」という二元論的な話はしません*10。

イラストはなるべく自作

わかりやすさのため、なるべく多くの挿絵を使っていく予定ですが、基本的に自作することにします。本シリーズでは、出典の明記がない場合、すべて著者の自作です。
一通り終わったら、加筆修正をしたのち*11、適当なライセンス（おそらくPublic Domain）で公開して、スライドやウェブページで自由に使えるようにしようと考えているからです*12。他の人がAGIを語るとき、挿絵としての選択肢が少しでも多くなればと思いこのような方針にしています。

なるべく英語で併記する

専門用語は、初出時には可能な限り英語表記も紹介します。これは、読者が脳科学に興味を持ったときにウェブページや論文の情報に触れやすくするためです。
日本語の文献だけだと英語表記がわからないため、論文を読むときに逐次翻訳しなければならず、非常に大変です。そのような労力はみなさんがする必要はないと考えます。

次回にむけて

日本語のウェブページや書籍では、先の図の上から下まで一気通貫で解説した物が少なく、また情報源が非常に古かったり、偏っていたりして、「人工知能を実現するために必要な情報」をまとめたものがないために執筆を決めました。
数学、情報工学、脳科学、神経生理学、心理学を織り交ぜながら広く浅く解説・紹介をしていく予定なので、以後お楽しみに。

*1:Daniel Wolpert の講演から引用

*2:James the photographer - http://flickr.com/photos/22453761@N00/592436598/ (CC BY 2.0)

*4:従来のAIを、古き良きAI(Good Old-Fashioned Artificial Intelligence, GOFAI)と呼ぶことがあるようですが、本稿では用いません

*5:人間(ホモ・サピエンス)は誕生以来ほとんど知能は変わっていないと思われる。このグラフの赤い線はかなり楽観的な傾きであって、実際は残念ながらほぼ平らである

*6:言うまでもなく、空を飛ぶときに鳥の骨や羽を研究することは有用だが、今回はわかりやすい例えとしてご容赦いただきたい。動力飛行発明までに多くの人が「羽ばたく」ことに固執して失敗していったように、空を飛ぶために最小限必要なものは何か？を考えるのと同様、人工知能も実現するための最小限の理論があるはずで、そこからさらに発展させていくという意味では脳の非常に細かな機能や挙動にも注意を払っていく必要があるだろう

*7:Deep Learning とニューラルネットワークについては、若干触れる予定

*8:クオリアの説明をするとそれだけでかなりの文量が必要になるという理由と、客観的に観測する方法がわかっていないため、ここで論じても意味が薄い、という理由

*9:機械論的唯物論、唯物論

*10:二元論を否定するわけではありませんが、「知性には霊的な存在が必ず必要である」と仮定すると、本シリーズの意味がなくなるため、機械論を前提にしないと以降の話が成り立たない

*11:間違いがたくさんある前提

*12:SVGの予定ですが、他の希望があればお願いします