Sideswipe

情報工学、計算論的神経科学など、真面目なこと書くブログ。お仕事の話は Twitter: @kazoo04 にお願いします。

五感

これは 人工知能アドベントカレンダー の7日目の記事です。

今回のテーマは五感ですが、視覚、聴覚、体性感覚(触覚)の3つをメインに触れます。ロボット的には嗅覚と味覚センサは一般的ではないですしね。

視覚

視覚は非常に複雑なプロセスで処理されており、脳の大部分(ある種の猿は大脳皮質の7割)は視覚処理をしています。
まず、光が目に入ってから視覚野までの経路を簡単に説明します。

f:id:kazoo04:20151124233304p:plain
視覚伝導路

網膜とサッケード

左右の目に入った光が網膜の錐体細胞*1・桿体細胞*2を刺激し、視覚刺激は視神経を通って視交叉を通過します。

網膜では視神経が通る部分には錐体細胞・桿体細胞ともに存在しないため、たとえ光が入ってきても情報が入ることはありません。これは盲点と呼ばれます。
また、それぞれの眼球中央よりすこし外側の網膜にはわずかに凹んでいる場所があり、中心窩と呼ばれここには非常にたくさんの錐体細胞があります。逆に言うと、中心窩からすこしでも離れると錐体細胞の数はどんどん減っていき、視野の端のほうには錐体細胞はほとんど存在しません。中心窩の大きさは、腕を前にまっすぐ伸ばし、親指を立てたときの爪の大きさくらいですが、そこ以外の部分は実はほとんど見えていないのです。

そのため、ヒトの目は見たいものを中心窩で捉えるために1秒に2, 3回ほどの頻度で常に目を動かしており、サッケード(saccade, 眼球跳躍運動、サッカードとも)と呼ばれます*3

f:id:kazoo04:20151201010401p:plain
サッケードとマイクロサッケード。点線で示した円が注視目標で、被験者はこの円をずっと見るように依頼される(実際の円はもっとずっと小さい)。被験者はまったく目を動かしていないつもりでも、実は常に小刻みに動いており、通常止まることはない。この動きはいくつかの種類にわけられる。ひとつは別の点にジャンプするように瞬時に移動するマイクロサッケード(フリックともいう)。もうひとつがドリフトとトレマであり、ドリフトは弧を描くように滑らかに移動していく動き、トレマは非常に小刻みに振動するような動きで、この2つが組み合わさって図で示したような動きになる*4

1秒に2,3回というのは相当な頻度ですが、そこまで目を動かしている感じは普段はしません。この理由はまだ不明な点も多いのですが、大雑把に言うと、目を動かすときにその動きを打ち消すような処理をしているため、サッケードが発生しても見ているものが動くようには感じられない、というわけです。

サッケードに関しては様々な研究があり、非常に奥が深いのですが、眼球運動をまじめに扱うとまた1日ぶん記事が増えるので、適当に割愛します*5

視覚伝導路

視交叉ではそれぞれの眼球の右視野と左視野の入力が交叉しており、右脳には左視野の、左脳には右視野の情報だけが送られます*6

そして、

  • 中脳の上丘に投射する経路
  • 外側膝状体(LGN)を経由して大脳の後頭葉にある一次視覚野(V1)に送られる経路

の2つの主要な経路に別れます*7

f:id:kazoo04:20151201011930p:plain
左は実際に見ているもの(あるいは見ていると感じているもの)であり、右は目が受け取っている情報をイメージしやすいように加工したもの(正確性は多少犠牲にしている)。
網膜に映るのはレンズを通しているため上下左右が反転しており、また中心部分には網膜神経節細胞が極めて多い中心窩が存在する。逆に言えば、人は視野の中心しかほとんど見えておらず、外側に行くに従って解像度が落ちると同時に色に対する感受性も低下する。そのため、常に眼球を動かして中心窩で捉える部分を変えていかなければならない。右図で中心よりすこし左にある灰色の円は盲点であり、この部分の情報は完全に欠落するが、脳内で補完されるために通常気づくことはない*8

視覚野

視覚野はある程度並列処理をしているものの、階層的な処理もしており、一次視覚野からスタートして次第に広がっていきまた特定の領野に収束していくという菱型構造になっています。

f:id:kazoo04:20151007192417g:plain
猿の視覚情報伝達経路。一番下のRGCは網膜、LGNは外側膝状体、V1から大脳新皮質(視覚野)で、おおまかに言うとV3あたりまでが後頭葉、その後はV4〜AITあたりの経路は側頭葉、MT野以降の経路は後頭葉に位置する。*9

視覚野(視覚野以外の領野も)は受容野というものがあり、たとえば視覚野では、あるニューロンは目に入ってきた映像のごく一部の部分のみを担当しています。受容野内の刺激が特定のもののときのみそのニューロンは発火します。
一次視覚野では、受容野内に特定の傾きの線(エッジ)があるときだけニューロンが発火します。たとえば、あるニューロンは10度傾いた線にのみ反応し、その近くにある別のニューロンは、20度傾いた線にのみ反応し…といった具合です*10

一次視覚野については、過去の記事を参照してください。

f:id:kazoo04:20131217175228j:plain
一次視覚野のモデル図。1〜6の数字は大脳新皮質の6層構造を、R, Lは右目と左目どちらからの入力が投射されているか、縦長の各ブロックはマイクロカラム、円柱のような構造はブロブ、カラムの横に小さく描いてある棒はどの角度の線に対してそのカラムが反応するかを表したもの*11 *12

f:id:kazoo04:20151201013047p:plain
目で見たものがどのようにV1に投射されるかを表した図。左は見る対象、右はV1にどのように投射されるかを表した。右半球の一次視覚野を切開して平面的に広げると右図のように映像が投射されている。右半分しかないように見えるが、既に述べたように右視野と左視野は別々の半球で処理されるためである。局所的な位相関係はある程度保たれているが、全体的に歪んだ状態でV1に投射されることがわかる。また、視野の中央付近の映像はV1の広い範囲で(拡大されて)処理されることがわかる。逆に視野の外側の映像はV1では狭い面積しか割り当てられていない。

上の図でもわかるように、ゆがんではいるものの一次視覚野でも網膜に写った像と同じ位相関係が保たれています。これをレチノトピー(retinotopy)と呼びます。言い換えると、一次視覚野で近くにある神経細胞は、視覚的にも近くにある範囲の処理を担当しています。この処理する範囲のことを受容野と呼びますが、受容野自体は一次視覚野以降の視覚野でも観察されます*13

二次視覚野(V2)では、一次視覚野から入力を受け取って、今度は複数の線を組み合わせたコーナー(角)などに反応するニューロンが現れます。四次視覚野(V4)は二次視覚野から情報を受け取って、さらに複雑な模様や色のパターンに反応するニューロンが現れます*14

このように、ひとつ前の(低次の)領野の入力を受け取って、なんらかの処理をしてより高次の領野に送るといったことをしているのは、視覚野に限らず大脳新皮質全体にいえる普遍的なしくみのようです。

腹側皮質視覚路

f:id:kazoo04:20151119013747p:plain
腹側皮質視覚路を示した図。LGNは視床の一部である外側膝状体(Lateral geniculate nucleus)である。V1は単純な線しか認識できないが、TE野では顔や手などの非常に複雑な形状の物が認識できていることがわかっている。このように、段階を踏んで次第に複雑な情報が扱えるようになっているのが視覚に限らず大脳皮質の基本的な仕組みだと考えられている。V4は本来脳の内側にあり、外からではほとんど見えないが、この図ではかなり誇張して描いてある。(再掲)

腹側皮質視覚路は、実験がしやすい(解釈しやすい)ことから大脳新皮質の中でも特によく解明が進んでいる部分です。
腹側皮質視覚路は、俗にWhat経路といい、目で見たものが何かを処理していると考えられています。つまり、りんごを見てそれがりんごであると判断する部分が腹側皮質視覚路(のIT野)になります。次で述べる背側皮質視覚路は、Where経路であり、どこにあるか?どう動いているか?を処理していると考えられています*15

既に述べたように、視覚野は段階的に複雑なものを処理するようになっており、V1では単純な直線とその傾きにしか反応しません。IT野になると、かなり具体的なオブジェクトに反応するニューロンが見つかっており、たとえば顔に反応するニューロンや、自動車に反応するニューロンや、さらに具体的な例としてシドニーのオペラハウスだけに反応するニューロンなどが報告されています。

背側皮質視覚路

f:id:kazoo04:20151126010327p:plain
背側皮質視覚路を示した図。V2までは腹側皮質視覚路と同じだが、その後経路がわかれて頭頂葉に向かって進んでいく。V3野のあとはさらに枝分かれし、体性感覚野の隣、IPLとSPLに到達する。V3野以降の経路がどうなっているのかはよくわかっていない点が多いが、両者は完全に分離しているわけではなく、少ないながらも相互に連絡をとっているようである。この点は腹側皮質視覚路を含め、大脳新皮質全体に共通している。すなわち、ある領野と別の領野との間にまったく接続がないというのは少なく、大抵は大なり小なり双方向の接続がある場合が多い。

聴覚

f:id:kazoo04:20151125003141p:plain
聴覚野の場所。濃い色で表示されている場所が一次聴覚野。二次聴覚野は一次聴覚野を囲むように存在し(ここでは図示していない)、その外側は聴覚連合野(薄い色で示した部分)。

聴覚野も視覚野同様複数の領野から構成されます。
現在はサルを対象とした研究で、17の領野に分類されますが、視覚野ほどには解明は進んでいません。各領野の機能はもちろん、それぞれがどのように接続されているのかもよくわかっておらず、ここでも簡単な紹介のみに留めます。

聴覚入力は一次聴覚野(A1)で処理されたあと、一次聴覚野を取り囲むように存在する別の聴覚野に出力されていきます。
各聴覚野に共通の構造として、ある小領域は特定の周波数の音だけを専門で処理しており、そこからほんの少しだけ離れた部分では、わずかに違う周波数の音を処理している、と考えられています。つまり、どの聴覚野を見ても、低周波数〜高周波数までを処理する専門の部分が均一に分布しています。これを周波数地図(トノトピー)といいます*16*17

体性感覚

体性感覚は、五感で言うところの触覚にあたるものです。
感覚器からの信号は脊髄を通って、他の感覚同様まずは視床に入力されます*18

f:id:kazoo04:20151206223445p:plain

視床からは主に一次感覚野に情報が転送され、ここで体性感覚の処理*19が行われます。ブロードマンの脳地図でいうと、1,2,3野にあたります(前から3,1,2の順)。さらに二次体性感覚野(43野)に情報が転送されます。

また、体性感覚野と平行して、視床から島皮質(insular cortex)にも投射があることがわかっています。島皮質は脳の奥、側頭葉と頭頂葉を繋ぐ場所にあり、具体的な機能はわかっていないものの、様々な部分で重要な役割を果たしていると考えられており、今後目が離せない領域です。体性感覚の側面から見ても、島皮質は痛覚との関連性が指摘されています*20

f:id:kazoo04:20151206224124p:plain
ペンフィールドホムンクルス。左は体性感覚野、右は運動野。図の上が頭頂で、皮質に沿って体のどの部位が対応しているかを表している。イラストの大きさはどれくらい脳の表面積が割かれているのかを表す。

ホムンクルス

視覚にレチノトピー、聴覚にトノトピーという、似た入力は脳内でも似た場所にあるという関係について触れましたが、一次感覚野においても体部位再現(ソマトトピー, somatotopy)があります。上の図がソマトトピーを表現したもので、ペンフィールド*21ホムンクルス(cortical homunculus)と呼ばれます。

このイラストでは、脳の各部位によって身体の担当箇所が異なること、身体の物理的な位置は概ね脳内でも似たような位置関係にあること(鼻と唇は近い、各指同士は近い、頭と脚は遠い領域で処理されている、など)また身体の実際の表面積・体積とは関係なく感覚が鋭い部分に多くの脳の面積が割かれていることなどがわかります。たとえば、腕や脚は実際の物理的な大きさの割にはほんの少しの領域しかマッピングされておらず、逆に唇や人差し指は身体の1%未満しか占めていないのに、脳内ではかなりの神経細胞がこれらの感覚の処理を受け持っているようです。物を触覚のみで判断するとき、足や背中で触れるよりは、手指を使って触れたほうがずっと細かい形状を把握することができますが、これはホムンクルスの図が表しているように、脳内でたくさんの神経細胞が処理に関わっているからだと考えられます*22

それぞれの感覚野の間は?

一次視覚野や一次聴覚野のような、身体入力が入ってくる部分を感覚野といい、そうでない部分を連合野といいます。連合野は感覚野あるいは低次の連合野から入力を受けて、高次の処理を行ってさらに別の連合野への入力をしていると考えられています。

VIP野

Ventral IntraParietal Area は視覚野と一次感覚野の間あたりにあり、その両方から入力を受けていることから、物理的な位置と視覚情報の両方が必要な処理に関わっていると考えられています。
たとえば、飛んでくるボールをキャッチしようとしたときは、視覚情報からボールの軌道を推測して腕を伸ばす必要がありますが、現実世界が3次元なのに視覚情報は2次元のためほとんどの情報は失われています。そのために視覚情報から元の3次元の世界を復元することは理屈上不可能*23です。しかも、身体感覚は視覚とはまったく異質な入力ですから、この必要な情報が揃っていない上に入力の性質も異なるような情報を統合させる必要があります。VIP野周辺では、うまいこと視覚と体性感覚の両方を処理して、このような問題を解いている、と考えられています。

言語野

先日触れた、言語野の一部であるウェルニッケ野や角回は、聴覚野と視覚野と感覚野に囲まれたような位置にあります。これも、たまたまこの位置が空いていたから配置されたわけではなく、それぞれの感覚をすべて統合することによって実現されていると考えられます。

このように、感覚野は比較的入力がはっきりしていることからその機能も調べやすいのですが、特に高次の連合野になると様々な入力が処理されたものが複雑に絡み合ってくるわけです。そのため「こういった作業をすると活動が活発になる」という相関はわかっても、具体的に「◯◯が入力で、◯◯という処理をして、◯◯という出力をする」と言葉では言い表せないようなものになってきます。

さいごに

今回は、視覚・聴覚・体性感覚を中心に解説しました。既にお分かりの通り、視覚だけは他とくらべてかなり研究が進んでおり、今回はご紹介できなかった興味深いことが山のようにありますが、割愛させていただきました。他の感覚に関しても今後の発展が望まれます。

どの部位に関しても、似たような入力は脳内の似た場所で処理されているようです*24。一口に感覚といっても視覚、聴覚、皮膚感覚はまったくその性質が異なるように思われますが、このような共通する構造が見られるということは、このような位相関係を維持すること自体になにか重要な役割があるのかもしれません。このあたりについては、後日すこし触れることにします。

*1:赤・青・緑の色にそれぞれ反応する

*2:光の明暗に反応する

*3:さらにマイクロサッケード(micro saccade, 固視微動とも)というものもあり、マイクロサッケードはさらにドリフト、トレマ、フリックという3種類の動きに分類される

*4:マイクロサッケードあるいは固視微動は、ドリフト・トレマ・フリックをまとめて言うときと、フリックのことだけを指すときがあり用語に若干混乱がみられる

*5:サッケード、マイクロサッケードともにどういった機能があるのか、どのように実現されるのかについては謎が多い。サッケードの主要な目的は、解像度の中心窩でものを捉えることである。マイクロサッケードは網膜像を鮮明に保つために必要だと考えられているが、どれくらいノイズが寄与しているのか、ドリフト・トレマ・フリックそれぞれの機能についてはよくわかっていない

*6:図を見て「右脳には右視野の、左脳には左視野の情報が入るのでは?」と思ったかもしれない。目に入ってきた像は上下左右が反転していることに注意。

*7:上丘を介して高次視覚野に伸びる経路もわずかながら存在する

*8:盲点が発見されたのは1660年であることから、何百万年もの間、「目には見えていない部分がある」ということに誰も気づかなかったことになる

*9:Felleman, D. J. & Van Essen, V. C. (1991) Distributed hierarchical processing in primate visual cortex.

*10:ここでは「線」といっているが、実際は線というよりは波のほうがよく表せる。特にガボールフィルタでよく近似できることは古くから知られている

*11:Livingstone and Hubel, J. Neurosci. 4, 309-356, 1984

*12:ただし、実際にはこのような縦横方向へ整然と並んでいるわけではなく、どちらかというと渦巻き状に似たコラムが並んでいることがわかっている

*13:ただし受容野のサイズは次第に大きくなっていくことが知られている

*14:昔はV4で初めて色の処理を行うようになると思われていたが、今ではV1に存在するブロブという構造でも色を処理することがわかっており、従来考えられていたよりV1の段階でも比較的複雑な処理をしているとされる

*15:今ではより広範な処理に関わっているとされる。たとえば、把持機能(物をつかむ)との関係など。物をつかむときは対象の形状にあわせて手首を回転させたり手を開いたりしなければならないが、この処理に背側皮質視覚路が重要だという意見がある

*16:似た位置にある領域では似た周波数の音を処理していると書いたが、実は最近になって間違いかもしれないと指摘されています。研究では、ネズミの聴覚野を詳しく調べた結果、ある周波数を処理する部分は領野内にバラバラに存在しており、たとえば低い周波数を処理しているすぐ近くに高い周波数の音を処理している部分があったりする

*17:Bandyopadhyay et al. Dichotomy of functional organization in the mouse auditory cortex. Nature Neuroscience, 2010

*18:脊髄のどの位置を通るか、視床のどこに入力されるのかは体の部位と感覚(痛覚、温度感覚、etc.)によって変わる

*19:具体的に何をどう処理しているのかはあまりわかっていない

*20:AD Craig. Interoception: the sense of the physiological condition of the body. Curr. Opin. Neurobiol.: 2003, 13(4);500-5

*21:Wilder Graves Penfield (1891-1976) はカナダの脳外科医。てんかん治療の際に、脳を電気刺激すると様々な感覚を呼び起こせることを発見した

*22:これを見ると実に体性感覚野の半分程度は首から上の処理に割かれていることがわかる。異物を食べないようにすることや、話すことがヒトにとって非常に重要な役割を果たすからだろう

*23:このように、問題を解くのに必要な材料が足りないために正しい解が決定できないような問題を、不良設定問題という

*24:聴覚は既に脚注で触れたとおりちょっと怪しい

小脳

これは 人工知能アドベントカレンダー の6日目の記事です。

小脳は他の部位と違って、比較的わかっていることが多い部分です。今回はこの小脳について解説します。
小脳は霊長類はもちろん、魚類から哺乳類にいたるまで、種を超えて脊椎動物すべてに共通した構造をもっていることから、無くてはならない重要な器官であるとされます。

概略

f:id:kazoo04:20151123154017p:plain

主な機能

小脳(cerebellum)の主要な機能は

  • なめらかな随意運動
  • 身体の平衡を保つ
  • 歩行

であり、1950年代にはすでに「小脳はなめらかな随意運動に必須」ということがわかっていました。たとえば、目の前にあるペンを取ろうとするとき、手をなめらかに移動してペンに到達させることができますが、小脳が障害されているとき*1はこの滑らかさが失われ、手の動きが早すぎたり遅すぎたりする状態を交互に繰り返すような動きになってしまいます*2

f:id:kazoo04:20151123153802p:plain
小脳疾患患者の手の動き。上に書いてある線をトレースしようとしたのが下の図。滑らかさが失われ、ぎこちない動きになっていることがわかる*3

その後、非陳述記憶にも深く関わっていることがわかっており、運動だけでなく脳の様々な機能を担当しています。

構造

小脳も大脳同様、左右の半球に分かれています(小脳半球)。また、半球の間には小脳虫部(vermis)があります。
小脳虫部は身体の中心部、体幹を受け持っており、小脳半球は四肢の運動を受け持っています。そのため、小脳虫部が障害されると全身のバランスが崩れ、歩いたり立っていたりするのが難しくなります。右半球が障害されると右手や右足、左半球が障害されると左手や左足の動きに影響が出ることから、小脳内部では身体のどこを受け持つのかという担当がはっきりわかれていることがわかります。

そしてやはり大脳同様、小脳も小脳皮質という3つの層に覆われています。

f:id:kazoo04:20151124012007p:plain
マウスの小脳。蛍光タンパク質によってプルキンエ細胞が発光している。横に並んでいる丸い細胞がプルキンエ細胞で、上に向かって根のように樹状突起が伸びている。画像中央で横方向に大量に走っている繊維がある場所は白質。*4

f:id:kazoo04:20151124005649p:plain

小脳の概略図。細かい部分は省略してある。上3つの青字で示した、分子層、プルキンエ細胞層、顆粒細胞層が小脳皮質。

前述のようにこの構造はすべての脊椎動物に共通していることから、非常に重要かつかなり洗練されたものになっていると考えられます。
綺麗な3層構造をしていること、それぞれの細胞がどのように接続しているのかがわかっていること、様々な動物で共通の構造をしていること、などの理由から、小脳は大脳新皮質大脳基底核と比べると早い段階からその機能がわかっており、モデル化も進んでいる部分です。小脳のモデル化やシミュレーションについては、後日「小脳のモデル」で触れることにします。

*1:先天性のものもまれにあるが、脳卒中や脳腫瘍、外傷、アルコール中毒などが原因

*2:Flash, T., Hogan, N. 1985. The coordination of arm movements: an experimentally confirmed mathematical model. J. Neurosci., 5, 1688-1703.

*3:Figure 67of the book "Cerebellar functions" by André Thomas (Public Domain)

*4:The Gene Expression Nervous System Atlas (GENSAT) Project, NINDS Contract # N01NS02331 to The Rockefeller University (New York, NY). (Public Domain)

間脳・中脳と大脳基底核

これは 人工知能アドベントカレンダー の5日目の記事です。

脳は大脳、中脳、小脳からなっており、大脳はさらに終脳(大脳半球とも言う。脳の大部分を占める、しわで覆われた組織)と間脳から構成されます。

中脳

中脳(midbrain)は、間脳と橋(pons)の間にあり、被蓋、上久、下丘、赤核などから構成されています。ここは間脳より低次の反応を受け持っていて、いくつかの反射(急に眩しい光が当てられたときに目を瞑る、環境の明暗に応じて瞳孔を収縮させる、立っている状態で急に身体を押された時にバランスを取って倒れないようにするなど)や、歩行パターンのリズムを生み出したりする部分です。中脳については、本Advent Calendarではこれ以上は触れません*1

間脳

間脳(diencephalon) は、下位の中枢からの入力を終脳に転送する中継地になっています。

たとえば、視覚刺激は網膜から直接視覚野(17野)に届くわけではなく、間脳にある視床(thalamus)*2を経由してから視覚野に入力されます。これは他の感覚でも同じで、嗅覚を除くすべての感覚入力はいったん視床に入ってきます。

大脳基底核

大脳基底核(basal ganglia)は非常に重要な部位で、今後も度々登場するためにある程度詳細に説明します。
昔は大脳基底核の機能は運動の細かい制御だけだと考えられていたのですが、現在は運動調整はもちろん、感情、動機付け、学習などに重要な役割を果たしています。

その名前からも明らかなように、大脳基底核は大脳の一部であるので、本来は前回触れておくべきだったのですが、間脳との極めて密接な関わりから、今回一緒に紹介します。

構造

間脳や大脳基底核の構造は非常に複雑で、多数の神経核が複雑に接続されています。そこで脳の深部から順番に見ていきましょう。

脳梁・中脳

f:id:kazoo04:20151123023455p:plain

大脳は2つに分かれており、右脳と左脳から構成されていることはみなさんご存知だと思います。ここでは、脳を半分に切って、右半分だけを表示しています。
脳の中央は、脳梁・中脳・橋・延髄などからなっています*3。脳梁(corpus callosum, CC)は右脳と左脳を相互に接続する約3億もの神経線維の束で、砕けた言い方をすれば右脳と左脳が情報をやり取りするためのケーブルです。そのため脳梁そのものがなにかの情報処理をしているわけではありませんが、ここではわかりやすさのために表示しています。

橋(きょう, pons) は、顔面神経や三叉神経などの神経核や、大脳からの出力を受け取って、小脳へ転送する役割を果たしています(この、「大脳の出力を小脳に転送する」という機能は実は極めて重要ですが、これは後日解説します)。

脳下垂体(のうかすいたい, pituitary gland, 単に下垂体とも言う)は、ホルモン分泌のための器官ですが、今回の汎用人工知能という話題との関わりは薄いので以降は詳しく触れません。

なぜまずこれらの器官をピックアップして紹介したのかというと、これらがちょうど脳の真ん中に位置しているからです。次から紹介する他の器官、たとえば視床や海馬や線条体は、すべて左右2つずつ存在します*4。脳は大脳皮質だけではなく、これらの器官も左右に別れて存在しているのです。

ですから、以降に紹介するものは、次第に外側、言い換えると左耳に近づくようにして配置されていきます。中脳や橋はこれらの器官に挟まれて存在しているともいえます。

間脳(視床)

f:id:kazoo04:20151123023612p:plain

間脳は

で構成され、さらに視床下部

  • 松果体(pineal body)
  • 下垂体(pituitary gland)
  • 乳頭体(mammillary bodies)

から成っています*5

視床は始めにも説明しましたが、嗅覚を除くあらゆる感覚の中継地点です。さらにここでは上丘と下丘も示していますが、これらは本来中脳に属する器官で、視覚・聴覚情報を中継して小脳につながっています。

海馬体

f:id:kazoo04:20151123023620p:plain

さらに視床を囲むようにして、乳頭体・脳弓・海馬体があります。

線条体大脳基底核

f:id:kazoo04:20151123023626p:plain

大脳基底核は、おおきくわけると線条体扁桃体の2つから成り立っています*6
大脳基底核レンズ核という丸くなっている部分から、尾状核という尻尾のような部分が生えています。
さらにレンズ核被殻淡蒼球に分かれています*7
尾状核レンズ核視床をぐるっと囲むように弧を描いて、扁桃体と接続しています。

扁桃体は、同時に海馬の先端にも接続されているため、大脳基底核に含める場合と、大脳辺縁系に含める場合の両方があります。

側坐核

側坐核大脳基底核に含める場合と、大脳辺縁系に含める場合がありますが、ここは快感や中毒性などを処理しています。

Oldsらは、ラットがレバーを押すと側坐核を刺激する実験をしたところ、食事もとらずにひたすらレバーを押すという行動を発見しました*8
このことから、側坐核は「快楽中枢」とも呼ばれており、ここからなにかを欲するという動機付けが行われていると考えられています。

ただし、この実験では何かがほしいと思うこと(欲求)と、快感を得られること(快情動)が区別されていません。本来は、快情動が得られるからそれを欲するようになるわけで、両者は区別して考える必要があります。

つまり、なにか行動をする→快感が得られる→快感が得られるような行動が強化される→欲求が生まれる という順番があるはずです。このあたりのモデルに関しては、後日の大脳基底核の項目で詳しく述べることにして、ここでは「側坐核は快楽中枢である」ということに留めておきます。

扁桃体

扁桃体(amygdala, 扁桃核ともいう)は、大脳辺縁系に加える場合と大脳基底核に加える場合があるということはすでに述べましたが、ここは感情と記憶に関係していると考えられています。経験的にも、強い感情が伴うできごとはそれがたった1度であっても長い間記憶に残るということがおわかりになるかと思います。特に扁桃体は恐怖に関する活動が顕著で、アカゲザルを対象とした実験では、扁桃体が損傷すると恐怖を感じなくなることがわかっています(たとえば本能的に怖がるはずのヘビをつかんで口の中に入れるなど)*9*10

帯状回

f:id:kazoo04:20151123023710p:plain

帯状回(cingulum) は、脳梁付近に存在する脳回で、大脳辺縁系と大脳新皮質を接続する役割を果たしています。

大脳基底核の機能

既に述べたように、大脳基底核は昔は運動の制御に関わっていると考えられていましたが、今では動機付けや学習に非常に深く関わっていることがわかっています。
詳しくは、後日の「大脳基底核のモデル」で触れることにしますが、簡単にいえば大脳基底核は「自分にとって得がありそうなことをし、損しそうなことは避ける」という生きる上で非常に重要な役割をしていると考えられています。そのために、大脳基底核大脳基底核の各部位同士はもちろん、高度な推測に必要な大脳新皮質と、身体感覚の入出力の中継地である視床と密接に接続されています。

大脳基底核の回路

身体情報はまず視床に入ってきますが、そのあとは、視床大脳新皮質大脳基底核と信号が伝達され、最後にまた視床に戻ってくるというループを形成しています*11

f:id:kazoo04:20151123031537p:plain
脳の冠状断面

上記が視床大脳新皮質大脳基底核、大脳辺縁系における主要な回路です*12
これは冠状断面(coronal section)といって、脳を前と後に分割するように切断したときの断面を表示しています。言い換えると、両肩を通るような切断面で脳を切ったときの断面です。図の右側が左手側、図の左側が右手側、図の奥方向が後ろ(背側)で、手前が前(腹側)です。

代表的な経路として、直接路があります。これは、視床→大脳皮質→線条体淡蒼球内節/黒質網様部→視床の経路です。

f:id:kazoo04:20151123031549p:plain
直接路

ハイパー直接路というものもあります。こちらは線条体を経由せずに大脳皮質から視床下核淡蒼球内節/黒質網様部→視床という経路をとっています。
また、線条体から淡蒼球外節に繋がっている経路は間接路と呼びます。

f:id:kazoo04:20151123031554p:plain
ハイパー直接路

直接路は興奮性、間接路は抑制性の経路であり、この2つがうまくバランスをとることによってなめらかな随意運動(自分で動かそうと思って行う運動)を実現していると考えられており、このバランスが崩れた状態が、パーキンソン病ハンチントン病です。

このように、一度視床に入ってきた情報は、その一部は脳幹からまた外に出て行く(つまり、体を動かすための信号)ものの、ほとんどは大脳皮質と大脳基底核を経由してまた戻ってくることがわかります。より局所的に見ると、それぞれのループは役割が異なるようで、体を動かすための運動ループ(motor loop)や、前頭前野ループ(prefrontal loop)、辺縁ループ(limbic loop)などがあり、それぞれ視床の違うところがから出発し、違うところに戻ってきているということがわかっています*13。単にループしているだけでなく、いくつかの処理が並行して走っているようです。

コンピュータのトランジスタと異なり、神経細胞の反応は非常に遅いので、こういった並行処理は脳のいたるところで見受けられます。

これらの回路がどういった役割を果たしているのか、どのような仕組みなのかについては、また後日触れることにします。

*1:中脳の解説をするには余白が少なすぎるし、原始的な機能を担当している性質上、人工合成知能を作るという点では関わりが少ないため

*2:正確には、視床にある外側膝状体(lateral geniculate nucleus, LGN)に投射される

*3:小脳も見えるが、ここでは触れない

*4:中脳内部にある、たとえば赤核黒質などもやはり左右2対になっている

*5:視床視床下部のみをもって間脳を指すこともある

*6:ただし、扁桃体大脳基底核ではなく大脳辺縁系に含めることもある

*7:図ではわかりにくいが、被殻レンズ核の外側、淡蒼球レンズ核の内側の領域を指す

*8:Olds J, Milner P (1954). "Positive reinforcement produced by electrical stimulation of septal area and other regions of rat brain". J Comp Physiol Psychol 47 (6): 419–27.

*9:さらに、食べられる物とそうでない物の区別がつかなくなる、なんでも口へ運ぼうとする、他の種や無機物に対しても性の対象にするといった行動も見られ、これはクリューバー・ビューシー症候群(Klüver-Bucy syndrome)と呼ばれる。クリューバーとビューシーの論文では「精神的失明(psychic blindness)」と書かれている

*10:Klüver H, Bucy PC. Psychic blindness and other symptoms following bilateral temporal lobectomy in Rhesus monkeys. Am J Physiol 1937;119:352‑3.

*11:Alexander GE, Crutcher MD. Functional architecture of basal ganglia circuits: neural substrates of parallel processing. Trends Neurosci 1990; 13: 266-271.

*12:本当はもっと複雑だが、思い切って簡略化して表示していることに注意

*13:Alexander GE, et al. Parallel organization of functionally segregated circuits linking basal ganglia and cortex. Annu Rev Neurosci 1986, 9: 357-381.

大脳新皮質

これは 人工知能アドベントカレンダー の4日目の記事です。

大脳は、大脳半球(cerebral hemisphere) という左右2つの部位に分かれています。いわゆる右脳と左脳というものにあたります。
両者は完全に分離しているわけではなく、脳梁(corpus callosum, CC) によって接続されており、相互に情報のやり取りをしています。
それぞれの大脳半球は、大脳皮質(cerebral cortex)が表面を覆っており、その内部には大脳基底核(cerebral basal ganglia)が収まっています。

大脳皮質はさらに以下の3つにわけることができます。

  • 新皮質(cerebral neocortex) 大脳の表面にある6層構造を持つ薄いシート状の皮質で、あとで詳しく述べる
  • 古皮質(paleocortex) 梨状前皮質など。霊長類では退化してあまり見られない。
  • 原皮質(arichicotex) 海馬体などを構成する。

ここでは、霊長類、なによりヒトで特に発達している大脳新皮質を扱います。

概要

大脳皮質の役割は、ものを知覚したり、運動を制御したり、未来の予想、計算、推理、などまさに知性を司るといっていい器官です。
たとえば、大脳皮質の視覚を処理する部分が不可逆的に破壊されると*1、網膜や視神経はまったく問題がないのにもかかわらず、ものが見えなくなります*2

大脳の外観

回と溝

大脳はすでに述べたように、薄い(1mm〜3mm)シート状の組織で、約2500平方センチほどの面積があります。これは新聞紙1枚を広げたくらいの大きさなので、相当な面積があることがわかります。これがしわしわに折りたたまれて頭蓋骨の中に格納されています。この畳んだときに、表面に出てきている部分を、脳回あるいは回(gyrus)といい、逆に奥に入り込んでいった部分(外からでは直接見えない部分)を脳溝あるいは溝(sulcus) といいます。特に目立つ、あるいは重要な脳溝には名前がついています(特に中心溝とシルヴィウス溝は重要です)。

f:id:kazoo04:20151118020921p:plain

大脳皮質は、脳溝と機能をもとにおおきく4つの領域にわけられています。これを大脳葉(lobe)といいます。

  • 前頭葉 (frontal lobe)
  • 頭頂葉 (parietal lobe)
  • 側頭葉 (temporal lobe)
  • 後頭葉 (occipital lobe)

前頭葉は物事の判断や計画に関わっており、頭頂葉は運動と皮膚感覚、側頭葉は見たり聞いたりしたものがなにかの認識、後頭葉は視覚について処理をしています。
それぞれの細かい機能や仕組みについては、また後日触れることにします。

前頭葉、側頭葉、後頭葉の末端部分は、特に極(pole)と呼ばれます。

f:id:kazoo04:20151118021021p:plain

脳の機能局在

すでに葉の項目で述べたように、脳は場所によって処理するものが違うということがわかっています。
次の図は、回を基準にして、おおまかな役割で新皮質を色分けしたものです。

f:id:kazoo04:20151118021832p:plain

弁蓋部・三角部・眼窩部はまとめて下前頭回といい、縁上回・角回はまとめて下頭頂小葉といいます。
たとえば弁蓋部と三角部は言語処理、特に言語を生み出すこと(口で話す、手話で話す、など)に対して重要な役割を果たしており、運動性言語中枢と呼ばれます*3

ここから、さらに機能的、解剖学的に細かく脳の領域を分類していった「ブロードマンの脳地図」があります。
これは、ドイツのコルビニアン・ブロードマン(Korbinian Brodmann, 1868〜1918) が細胞染色をして、似た構造の部分をひとまとまりとして、52の領野に区切ったものです。

f:id:kazoo04:20151007202644j:plain
ブロードマンの脳地図。色が違う部分はある特定の処理を担当していると考えられている。(Public Domain)

f:id:kazoo04:20151118022629g:plain
Korbinian Brodmann, 1868〜1918 (Public Domain)

今日では、fMRIなどの脳イメージングによってさらに細かい脳の働きがわかり、ブロードマンの脳地図はさらに細かい領野にわかれていることもわかっていますが、一般にはブロードマンの脳地図をもとにして部位を呼びます。
各領野には1〜52までの番号が振られており、また同時に名前もつけられています。たとえば、17野は一次視覚野という名前がついている、というように。

各領野は相互に連携して情報処理をしていることがわかっており、概ね近くにある領野は相互接続されていることが多いことがわかっています(まれに遠くにある領野同士が接続していることもあるが)。

以下の図は、脳の腹側皮質視覚路(Ventral stream)を表した図です。腹側皮質視覚路はものを見て、それがなにかを判断する(たとえば、目でリンゴを見てそれがリンゴだとわかる)ために重要な経路になっており、後頭部にあるV1(17野と一致)で処理された内容が、V2(18野と一致)に入力されます。V2でまた情報処理がされ、次はV4に入力され、次に…といった具合にどんどん上位の領野に情報が転送されていきます*4。詳しくは、「五感」および「視覚野のモデル」などで触れるためここでは簡単な説明に留めますが、V1は線の傾き程度しか処理できないのですが、V2になると線を組み合わせたコーナーの判断ができるようになり、V4になるとさらに複雑な模様や色がわかるようになり…といったように、下位の領野ではより単純な処理を、上位の領野では複雑的・抽象的な処理を行うといった多段階構成になっています。

f:id:kazoo04:20151119013115p:plain

腹側皮質視覚路を示した図。LGNは視床の一部である外側膝状体(Lateral geniculate nucleus)である。V1は単純な線しか認識できないが、TE野では顔や手などの非常に複雑な形状の物が認識できていることがわかっている。このように、段階を踏んで次第に複雑な情報が扱えるようになっているのが視覚に限らず大脳皮質の基本的な仕組みだと考えられている。V4は本来脳の内側にあり、外からではほとんど見えないが、この図ではかなり誇張して描いてある。

局所構造

層構造とコラム

大脳新皮質は6層構造になっており、脳の表面から深部に向かって順に

  • Ⅰ 分子層(molecular layer)
  • Ⅱ 外顆粒層(external granular layer)
  • Ⅲ 外錐体細胞層(external pyramidal layer)
  • Ⅳ 内顆粒層(internal granular layer)
  • Ⅴ 内錐体細胞層(internal pyramidal layer)
  • Ⅵ 多型細胞層(polymorphic layer)

と名前がついています。

f:id:kazoo04:20151118205451p:plain

大脳皮質の6層構造のスケッチ*5。左は細胞染色、右は繊維構造。

各層が具体的になにをしているのかについては謎が多いのですが、主にVI層に視床からの入力があり、V,VI層から視床への出力があるといった傾向があります*6。また、場所によってある層が厚く、ある層は薄いといった傾向も見られます。ブロードマンの脳地図も6層構造の不均一性をヒントにして分類したものです。

層構造は横方向へ伸びていますが、縦方向に関してもある一定の構造が見られます。これをミニ円柱(minicolumn)とよび、25〜40μmほどの大きさです*7。人間の大脳には200億個のニューロン、2億個のミニ円柱があると見積もられています*8*9。つまり、1つのミニ円柱の中にはだいたい100個くらいのニューロンが含まれていることになります。

さらに、このミニ円柱が100個ほど集まって、機能円柱(column)を構成しているといわれています*10。「いわれている」というのは、ミニ円柱と機能円柱の関係がまだ明確にわかってないためです。ただ、1つの機能円柱に含まれるミニ円柱は、似た刺激に対して反応するので、機能円柱が大脳皮質の処理における最小単位だといえます。

ここまでをまとめると、大脳皮質は機能円柱という縦長の柱のような構造から成っており、その機能円柱がびっしりと密集することによって1枚のシート状の組織になっているのが、大脳皮質です。

というわけで、機能円柱がどのような仕組みで、なにを処理しているのか、という点がわかれば大脳皮質のかなりの部分を再現できそうですが、やはりそれは難しく、かなりわかってきた部分もあるとはいえ、まだまだ謎が多いというのが実情です。

コラムの内部構造

次にコラムの内部がどうなっているのかについて見て行きましょう。

I層(分子層)については、ほとんど細胞がなく、樹状突起や軸索が走行しているのみです。
II層(顆粒細胞層)は比較的小型で丸い形をした顆粒細胞(granule cell)と呼ばれる細胞が多く、III層(外錐体細胞層)は三角形のような形をした錐体細胞(cone cell)が多くを占めています(この錐体細胞の授業時突起が伸びていって、I層に広がっている)。
II層とIII層の機能は似ていて、主にIV層から入力を受け取り、他の領野に出力を送っています(投射している、という)。

f:id:kazoo04:20151119012700p:plain

今ちょうど出てきたIV層はというと、有棘星状細胞(spiny stellate cell)や星状錐体細胞(star pyramid cell)が多く、(大脳皮質のほかの領野からではなく)外部からの入力、主に視床からの入力を受け取っています。そしてII層とIII層へ出力を送り、また同時にわずかではありますがIV層から直接他の領野へも出力を送っています。いわば、ここが大脳新皮質の入力を担当している部分です。

次にV層,VI層ですが、ここはIV層とは逆に、視床に対して出力を送っているところ、つまり大脳新皮質の出力部分にあたる層です。概ねIV層からの入力を受けています。

重要な点として、III層からの出力は主に上位の領野(のIV層)になされるのに対し、V,VI層からの出力は視床とさらに下位の領野のI層に対してなされているという部分です。言葉ではわかりにくいので、次の図を見てください。

f:id:kazoo04:20151119012149p:plain

ある領野のコラムから上位と下位の領野にどう接続されているかを説明した図。IV層に入力された情報は、II/III層で処理されて上位の領野に送られる。一方で、II/III層とV/VI層の出力は下位の領野のI層やV層にも送られるという、フィードバック回路になっている。また、別の見方をすると、大脳皮質は視床大脳基底核からの入力を受け取り、処理結果をまた戻すということもしている。ただしこの図は代表的なもののみ示してあり、実際にはかなり複雑な回路になっていることに注意。

コラムの機能

コラムがなにを処理しているのかはよくわかっていません。ただし、大脳皮質を観察すると、視覚を処理するところ、聴覚を処理するところ、運動を制御するところ、声を聞いたり、話したりするところはもちろん、未来を予想したり、数学の問題を解こうとしたり、チェスの盤面から戦局を判断するところといったあらゆる領野でこのコラム構造が見られる*11ことから、このコラムが大脳皮質における情報の基本単位であり、かなり万能なモジュールであるということがわかります。これがわずか100個程度のニューロンから成り立っていることは驚くべきことです。

まとめ

ヒトの知性の源といっても過言ではない、大脳皮質について説明しました。
大脳皮質は他の動物と比較したときにヒトで特別発達している部位であり、であるがゆえにヒトは高度な知性を持っていると考えられています。
大脳皮質はさまざまな機能をもつ多数の領野から構成されていますが、一方で生理学的にはかなりのっぺりとした、どこを見ても同じモジュール(コラム)が続いているという均一な構造をしています。
このことから、大脳皮質はなにか単一の仕組みによって動作していると考えられますが、いまだそのメカニズムについては不明な点が多く、謎の多い部位でもあります。とはいえ、すでに判明していることも多く、またDeep Learningとも関連が深いところもあるので、それは追々触れていくことにしましょう。

*1:外傷や、脳内出血、脳梗塞など

*2:視覚失認という。視覚失認にもさまざまな種類があるが、これは「高次脳機能障害と分離脳」の項で扱う

*3:一般にはブローカ野と呼ばれるが、ブローカ野の役割については、後日詳しく述べる

*4:V3は背側皮質視覚路に属しており、動きの判断のために働いているためここでは出てこない

*5:Henry Gray (1918) Anatomy of the Human Body

*6:これはかなり大雑把な説明であり、細かい点については後述する

*7:Jones EG. Microcolumns in the cerebral cortex. Proc Natl Acad Sci 2000;97(10):5019–21.

*8:Towards cortex sized artificial neural systems, Christopher Johansson and Anders Lansner, Neural Networks, Vol. 20 #1, pp48–61, Elsevier, January 2007

*9:「1000億個のニューロンという表記もあるが、これは大脳皮質以外のニューロンも含めた数である」

*10:A Peters, C Sethares, Myelinated axons and the pyramidal cell modules in monkey primary visual cortex. J. Comp. Neurol.: 1996, 365(2);232-55

*11:ただし、各層の厚みは異なり、たとえば一次視覚野ではIV層が厚く、一次運動野ではIV層がほとんどないかわりにV層が非常に厚い

ニューロンの概要とそのモデル

これは 人工知能アドベントカレンダー の3日目の記事です。

ニューロン(Neuron) または神経細胞は、脳を構成する最小単位であり、端的には信号を受け取り、別のニューロンへまた送っていくという役割をしています。

機械学習ニューラルネットワークとよばれる分野では、ニューロンの振る舞いを思い切り簡略化したものが使われますが、実際のニューロンは非常に複雑な振る舞いをします。
ここでは、ニューロンの概要について見ていきましょう。

生理学的な概略

ニューロンは、他のニューロンからの信号を受ける樹状突起(dendrite)と、他のニューロンに信号を送る軸索(axon) があります*1

f:id:kazoo04:20151117001007p:plain

神経細胞の概要図

見てお分かりのとおり、入力である樹状突起は細胞体から何本も枝分かれしていますが、出力である軸索は1つしかありません。もっとも、その軸索も枝分かれしていくつかの細胞へ同時に信号を送ることもあります。

入力刺激が入ってくると、活動電位が発生し、電気信号が軸索を伝わっていきます。これがニューロンの基本的な動きです。
また、伸びていった軸索は他の細胞の樹状突起と直接融合するように接続するわけではなく、シナプス間隙(synaptic cleft)が存在しており、この間は電気的ではなく化学的に信号をやり取りします。

樹状突起

樹状突起(dendrite)は神経細胞からまさに木の枝、あるいは根のように伸びている突起です。
細胞体からすこし太めの樹状突起が何本か生えていて、個々の樹状突起がさらに枝分かれしていくことで、多い場合で数千〜数万もの樹状突起を形成します。

神経細胞への入力は、すべてこの樹状突起を介して行われます。いわば、神経細胞の情報の入口にあたる部分です。

軸索

軸索は樹状突起とは逆で、神経細胞の出力信号が伝わる部分で、ひとつの細胞体からはひとつの軸索が出ています。軸索は1mmにも満たない場合もありますが、長い時は1m以上にも及びます*2

しばらく伸びていったあとは、樹状突起のように枝分かれの構造になっています。ここで他の神経細胞の樹状突起と結合(この部分はシナプスと呼ばれる)し、新たなネットワークを作るのです*3

ニューロンの発火

通常、ニューロンの細胞内の電位は、細胞外と比べると70mV程度低くなっています。この電位差を膜電位といいますが、樹状突起からある程度の入力があると、膜電位が変化します。
この変化には緩電位と活動電位がありますが、他のニューロンに信号を送るのは活動電位です。活動電位の変化は非常に急激で、1ms程度の間に数十mVほど上がりまたすぐに下がるという挙動をします。これらの挙動は、主にナトリウムイオンとカリウムイオンが、細胞内のイオンチャンネルを通じて内外とやりとりされることで行われます。
以下が活動電位の変化を説明したものです。

f:id:kazoo04:20151117001033p:plain

神経細胞の活動電位

膜電位はふだんは-70mV程度に保たれています(静止膜電位, Resting Membrane Potential)ここに他のニューロンからの入力があると膜電位が上昇しますが、閾電位(threshold of excitation) に達しなければまたすぐに減衰して、静止膜電位に戻ります(A)。

閾電位を超えるような入力があった場合は、閾電位を超えた瞬間に突然膜電位が急上昇します。これを脱分極、あるいはニューロンの発火といいます(B)。急激に上がったあと急激に下がるので、これをスパイク(spike)ともいいます。

ある程度(30mV程度)になると、ピークを迎え、今度は電位が下がり、静止膜電位を下回ります。これを過分極といい、特に静止膜電位よりも膜電位が下がった状態をアンダーシュート(Undershoots)といいます(C)。

過分極を迎えたニューロンは、入力があってもまったく反応しなくなる、不応期という状態になります(D)。ここから再び電位がすこしずつ上昇し、やがてもとの静止膜電位に戻ります(E)。

ニューロンのモデル

ニューロンの活動電位を表現する代表的なモデルとして、ホジキン・ハクスレーモデル*4と、それを簡略化したフィッツフュー・南雲モデルがあります。

ホジキン・ハクスレーモデル(Hodgkin-Huxley model)

ホジキン・ハクスレーモデル(ホジキン・ハクスレー方程式)は、 Alan Lloyd Hodgkin と Andrew Fielding Huxley がヤリイカ(Loligo pealei) *5の神経軸索を対象に活動電位を詳細に調査し、神経細胞膜の性質を方程式にまとめました*6

f:id:kazoo04:20151130211043j:plainf:id:kazoo04:20151130211045j:plain
Hodgkin(左) と Huxley(右) (Public Domain)

このモデルは以下の4変数からなる非線形微分方程式です。

{ \displaystyle
C\frac{dV}{dt} = I - g_{{Na}^+} m^3 h (V - E_{{Na}^+}) - g_k^+ n^4 (V - E_{k^+}) - g_{L}(V - E_{L}) \\

\frac{dm}{dt} = \alpha_m (V) (1-m) - \beta_m (V) m \\
\frac{dh}{dt} = \alpha_h (V) (1-h) - \beta_h (V) h \\
\frac{dn}{dt} = \alpha_n (V) (1-n) - \beta_n (V) n
}

Cは膜容量、Kは膜電位、m,hがNaチャンネルの活性化変数、kがKチャンネルの活性化変数を表していますが、ここでは数式そのものには踏み込みません。また、これを大幅に簡略化したフィッツフュー・南雲モデル (FitzHugh-Nagumo model)も有名です。こちらは生理学的な意味はかなり薄れてしまっていますが、簡単に挙動を再現できるのでよく使われます。

f:id:kazoo04:20151202222743p:plain

モデル出力の例。これは従来のモデルを改良したものだが、実際のニューロンと同じような振る舞いをすることがわかる*7

シナプスの可塑性

神経細胞から出た電気信号は軸索を伝わっていきますが、電子回路のようにそのまま直接別の神経細胞の樹状突起を通っていくわけではありません。シナプスでは神経伝達物質をやりとりするので、ここは化学的な方法で情報が伝わっていきます。

このシナプスの伝達効率は次第に変わっていくことがわかっており、これが脳を支えている基本的な原理です(=シナプス可塑性)。つまり、ある神経細胞から別の神経細胞には、入力があるかないかではなく、シナプスの伝達効率が次第に変化します。伝達効率が強化されれば神経細胞が発火しやすくなりますし、逆に伝達効率が低下すれば神経細胞はちょっとやそっとでは発火しにくくなります。

それではシナプスの可塑性はどのような仕組みで成り立っているのでしょうか?この点はまだ不明瞭な点もあるのですが、古くからヘブ則という仕組みが知られています。

ヘブ則

ヘブ則(Hebbian theory, Hebb's rule)*8は、ドナルド・ヘブ(Donald Hebb)が1949年に提案した、以下の仮説*9です。

「神経細胞Aの軸索が、神経細胞Bを発火させるのに十分近くにあり、繰り返しその発火に関与するとき、いくつかの成長過程あるいは代謝変化が一方あるいは両方の細胞に起こり、細胞Bを発火させる細胞の1つとして細胞Aの効率が増加する。」

長くてよくわかりません。より簡単に言うと、「神経細胞Aが神経細胞Bを頻繁に発火させるのなら、神経細胞Aの効率が良くなる」です。

この変化が脳の「学習する」「記憶する」という仕組みのベースになっていると考えられています*10

ここでは、「繰り返し」「頻繁に」と書きましたが、実は1997年にスパイクタイミング依存可塑性(spike timing-dependent plasticity, STDP) という仕組みも発見されました。
これは、何度も発火させる必要は必ずしも必要ではなく、「神経細胞Bが発火する少し前に神経細胞Aが発火していれば、シナプスが増強され、逆であればシナプスが弱まる」というメカニズムです。今ではSTDPもさかんに研究され、これを取り入れたアルゴリズムも多数提案されています。

神経細胞はなにをしているのか?

たくさんの神経細胞が、たくさんの繊維でつながって、それらはヘブ則やSTDPによって結合を弱めたり強めたりしていることはわかりました。それではこの仕組みで脳はどのような処理をしているのでしょうか?

まず考えられるのは、神経細胞が発火したときの電位です。つまり、情報を電圧の大小によって伝える、という仕組みです。これはわかりやすいのですが支持されていません。証拠がありませんし、なにより遠いところへ情報を伝えようとしてもだんだん電気信号が弱まっていくので、近くにある細胞と遠くにある細胞で伝える情報が変わってしまいます。もっとデジタルな方法で情報を表現していそうです。

発火率表現

次にありそうなのは周波数で情報表現する方法です(周波数コーディング、発火率コーディング, rate coding)。これはすでに観察されていて、たとえば感覚刺激の大きさと、感覚神経が発するスパイクの多さは比例関係にあります。つまり、皮膚をやさしく触った時はスパイクの数が少なく、強くつねったときはスパイクの数が増える、というわけです。

位相表現

発火率表現は、ある時間観察したときに何回神経細胞が発火したか(=スパイクがいくつあるか)だけに注目しましたが、いくつかの神経細胞が発火する時間差も重要そうです。これは位相表現、あるいはタイミング表現といい、こちらも実際に観察されています*11

脳は上記の発火率表現と位相表現をベースにして、さらに特定の細胞の組み合わせ(AとBは発火しているが、CとDは発火していない、など)や、ある神経細胞のグループが同時に発火したのか、順番に発火したのかなどの情報を利用としていると考えられていますが、このあたりの巨視的な動きについてはまだわかっていない点が多く、今もよく研究されています。

おばあさん細胞説

「記憶」のところでより詳しく触れますが、よく挙げられるものとしておばあさん細胞(grand mother cell)説があります。
これは、ある神経細胞は特定のあることを意味していると考えるモデルです。たとえば脳のどこかには「おばあさん」を表現する細胞があり、目でおばあさんを見たり、耳で「おばあさん」という言葉を聞いた時は、この神経細胞が発火する、というものです。

この説はちょっと無理がありそうです。なぜなら、神経細胞は基本的にどんどん減っていくので、たまたまおばあさん細胞が死んでしまったときは、「他のことはまったく問題ないが、おばあさんという概念だけはどうしてもわからない」といった事態になってしまいます。実際には、頭をすこし打ったり、歳をとったからといってそんなことは起きていないように思われます。

また、脳の細胞はすべて足しても860億程度しかないので、神経細胞ひとつひとつにあらゆる概念を対応させていこうとすると数が足りなさそうです*12

ところがこの説は割と支持されていて、たとえば側頭葉にはある特定の人物や建物を見た時だけに反応する神経細胞が見つかっています(たとえば、ビル・クリントンを見た時だけに反応する神経細胞や、シドニーのオペラハウスを見た時だけ反応する神経細胞がある)*13

このあたりの詳しいメカニズムは謎が多いのですが、ある特定の概念を表す細胞はあるものの、大抵の場合はいくつかのより低次元な特徴に反応する細胞が寄り集まって高度な概念を表現している*14、と考えられています。

大抵のものは様々な側面があり、たとえば自動車は色も形も大きさもいろいろな種類のものがありますが、どれも「車」だと認識することができます。また、「赤くて丸くて表面がつるつるしていて…」というものを見てあるときは「りんご」だと判断することができますし、あるときは「トマト」だと認識することができます。こういった複数の特徴をひとつにまとめあげてそれがなにかを認識するということはかなり複雑なメカニズムのはずですが、このあたりの仕組みはまだ大きな謎になっています(シンボルグラウンディング問題)*15

まとめ

脳を構成する最小単位である神経細胞について説明しました。
神経細胞の振る舞いについては、非常に細かいところまで研究されていますが、ここではごく基本的な部分にのみとどめました。

後日解説するニューラルネットワークは、この神経細胞を参考にして、コンピュータ上に脳を再現しようとする試みです*16

次回以降は、しばらく脳の各器官について見ていきますが、これらの大小様々な器官がこの神経細胞という単一の細胞の集合から成り立っているということは驚くべきことですね。

*1:ふたつをまとめて、神経突起(neurite)と呼ぶことがある

*2:たとえば、脊髄から足の筋肉まで伸びている運動神経繊維など(=末梢神経系)

*3:結合するといっても、実はここにはシナプス間隙という隙間があり(20nm程度)、両者は電気的には結合しておらず、神経伝達物質をやりとりする

*4:ホジキン・ハックスレーやホジキン・ハクスリーなど複数表記あり

*5:ヤリイカの神経軸索は肉眼で確認できるほど巨大なため、よくモデル生物として使われる

*6:この功績で、二人は1963年にノーベル生理学・医学賞を受賞した

*7:D Amsallem, Jan Nordström. High-Order Accurate Difference Schemes for the Hodgkin-Huxley Equations. Journal of Computational Physics, Vol. 252, November 2013, pp. 573-590 から引用

*8:ヘッブ則ともいう

*9: Hebb, D. O. The Organization of Behavior: A Neuropsychological Theory New York, Wiley & Sons: 1949

*10:今では、ヘブ則で説明ができないような振る舞いもあり、反ヘブ則(anti-Hebbian)と呼ばれる

*11:特に有名なのは海馬の場所細胞

*12:しかも長期記憶が蓄えられるとされる大脳皮質にいたっては100億くらいしかないうえに、そのうちの何割かは運動や感覚の処理に使われることを考えると、更に少ない数しかない

*13:Why your brain has a 'Jennifer Aniston cell' – being-human – 22 June 2005 – New Scientist

*14:ある細胞集団がどのようにして意味を表現しているのかについても複数のモデルが提案されている

*15:視覚のモデルで触れるが、Deep Learning はこの問題に対して完璧ではないもののある種の示唆をあたえた

*16:今のニューラルネットワークはあまりにも簡略化しすぎているので、脳を模倣しているとは到底いえないが、建前としてはそうである

脳の概要

これは 人工知能アドベントカレンダー の2日目の記事です。

はじめに

脳は言うまでもなく動物の知性の中枢であり、この器官を持つからこそ、私が書いたこの文章をあなたが読めるわけです。
この 1.5 kg 程度のピンク色の器官は、多数の神経細胞が相互に接続してネットワークを形成しており、それによって様々な能力を発揮しています。

脳の質量は体重の2%もありませんが、血液は心拍出量の15%、酸素は全身消費量の20%、ブドウ糖の消費は全身の25%と相当エネルギーを食っています*1
ただ、逆に考えると脳の消費電力は20W程度と考えられていますから、ノートパソコンの半分くらい*2の消費電力で済んでいるのでずいぶん省エネルギーではないでしょうか。

本稿では、まずはこの脳という存在がどのようなものなのかについて、ヒトのそれを中心に、その概観を探っていきましょう。

外観

頭皮を切り開き、頭蓋骨を取り除くと、脳は硬膜(dura mater) という厚い膜で覆われています。硬膜を取り除くと今度はくも膜(arachnoid mater)があり、その下には更に軟膜があるという3層構造で脳を保護しています*3

これらの膜を取り除くと、以下のように脳が見えます。ここでは、前頭葉、頭頂葉後頭葉、側頭葉からなる大脳新皮質(cerebral neocortex)と、小脳(cerebellum)、脳幹(Brain stem) が見えており、他の組織は大脳新皮質によって覆われているために直接は見えません。

f:id:kazoo04:20151118023337p:plain

大脳

大脳(cerebrum) *4は、一般的にイメージされる「脳」の部分で、脳の大部分を占めています。実際に外から見えているのは大脳皮質であり、この中に大脳基底核と大脳辺縁系という組織があります。また、大脳皮質は新聞紙1枚くらいの大きさ(2200平方センチくらい)で、厚さ1mmくらいのシートをクシャクシャにまるめて収めたような形になっています(脳の皺は、これだけ大きなシートを頭蓋骨に収めるために必要なものです)。大脳皮質のすぐ下には神経線維が密集した白質が広がっています。

言い換えると、大脳の中心部には大脳基底核と大脳辺縁系があり、それを覆うようにして大脳皮質があります。
大脳基底核と大脳皮質には神経細胞(ニューロン)が豊富に存在しており、大脳基底核と大脳皮質、あるいは大脳皮質同士、大脳基底核同士の神経細胞が相互に情報のやりとりをするためのケーブル(神経線維)が密集しているところが白質です。白質には神経細胞はほとんどありません。

大脳皮質

大脳皮質(cerebral cortex)の役割は、一言で言えば「考える」ことであり、また物を見たり、聞いたり、話したり、想像したりすることはすべて大脳皮質が深く関わっています。
大脳皮質は特に他の動物と比べてヒトにおいて発達している部位であり、それゆえに人は他の動物より高度な知性を有していると考えられています。

f:id:kazoo04:20151118023430p:plain

前頭葉はおもに計画立案*5、未来の予想、ルールを守る、長期的な得のために目の前の誘惑を我慢する、などの高度な機能を担当しています。

頭頂葉は体性感覚と運動、後頭葉は視覚入力の処理、側頭葉は視覚・聴覚の処理と記憶に関わっていると考えられています*6。このあたりは別の日に個別に見ていきましょう。

大脳基底核

大脳基底核(basal ganglia)は様々な部位から成り立っており、それぞれの部位はもちろんのこと、大脳皮質や小脳や脳幹とも接続されており、非常に幅広い処理を受け持っています。古くは運動の制御に関わっているとされていましたが、現在ではまだ不明な点が多いものの、運動の調整、記憶、学習、感情などに強く関わっているとされています。

大脳辺縁系

f:id:kazoo04:20151007201316j:plain

大脳辺縁系(limbic system) も大脳基底核同様、大脳皮質に隠れて見えない部分ですが、感情や記憶の制御に関わる重要な部分です。たとえば、海馬はこの大脳辺縁系に属する部位であり、記憶*7に関わっています。ほかにも、扁桃体は恐怖など、側坐核は快楽などの感情に関与しており、これらが海馬に影響することで記憶するべきことを制御していると考えられています。

大脳のこれらの部位はお互い密接に繋がっており、A→B→Cのように段階的、階層的に処理されているわけではなく、お互いに影響を及ぼし合いながら平行して様々な処理をしています。

間脳

間脳(interbrain, DiE)大脳半球と中脳の間にある器官で、

から構成されます*9。様々な働きをしており、特に視床は身体からのほとんどの入力を受け取って、脳の他の部位に転送している中継点であることから、ここでなんからの前処理をしていると考えられていますが、詳細な機能についてはよくわかっていません。
そのほか、自律神経やホルモンを調整して身体全体が正常に動くように常に制御している部位でもあります*10

小脳

小脳(Cerebellum)は脳幹の後ろ(背側)、わかりやすくいえば後頭部に存在する部位で、古くは運動の制御に関わっているとされていました(今はより広い処理に関わっていることがわかっています。これは後日ご紹介します)。

f:id:kazoo04:20151118023456p:plain

脳幹

脳幹(brain stem)は中脳(midbrain), 橋(きょう, pons), 延髄(medulla oblongata) から構成されています。
脳幹の役割は様々ですが、大脳や小脳と比べると、より生き物としての根源に関わる機能、つまり呼吸や心臓を制御したり、嘔吐・嚥下や消化を制御したり、大脳と小脳の中継をしたりしています。

中脳

中脳(midbrain)は脳幹の一番上にあり、間脳に挟まれるように位置しています。
ここは反射の制御や、視聴覚の中継などを担う生物にとって重要な部分です。

内部には

  • 上丘(superior colliculus, SC)
  • 下丘(inferior colliculus,IC)
  • 黒質(substantia nigra, SN)
  • 赤核(red nucleus, RN)
  • 大脳脚(cerebral peduncles)

などが含まれます*11

これらの組織は中脳内ではもちろん、大脳新皮質大脳基底核、大脳辺縁系、小脳、視床などと複雑につながっており、筋肉の動きを調整したり、瞳孔を収縮させたりといった意識には登らないような処理に深く関わっています。

f:id:kazoo04:20151118023517p:plain

神経細胞

脳は神経細胞(ニューロン, neuron)の集合であり、全体では約860億個*12*13ほどの神経細胞があると言われています。さらに神経細胞は神経線維によって接続されており、その数は1つのニューロンあたり数千から数万にものぼります。この神経細胞同士の情報のやりとりによって、脳のすべての機能が実現されていると考えられています。

以外にも、あきらかに巨大な大脳皮質にはたった19%のニューロンしか存在せず、体積では10%しかない小脳に80%のニューロンがあります。つまりほとんどのニューロンは小脳にあります。不思議ですね。
なぜ小脳にこんなに多くの神経細胞を割り当てているのかについては、後々触れることにしましょう。

よくある誤解

人間は脳の10%しか使っていない

この元ネタは、グリア細胞のようです。グリア細胞は神経細胞ではない神経系に存在する細胞で、情報処理以外の様々なサポート的役割を果たしています(たとえば、神経伝達物質を取り込む、栄養の供給など)。
グリア細胞は発見当初はよく機能がわかっていなかったのに加え、神経細胞の10倍ほど存在すると予想されていたのでこの10%説が生まれたのだと思います。今ではその機能が明らかになりつつあるのと同時に、そもそもグリア細胞自体神経細胞の10倍もなく、実際は1:1くらいの割合だということがわかっています*14*15

まあ確かにある処理をしているときに活動していない脳の部位は存在しますが、あるときに活動していないこと自体に意味を持つこともあるのです*16。信号機はある瞬間を見ると3つあるランプのうちの1つしか点いていませんが、これをもって「信号機がうまく動いていない」とは思いませんよね。常に3つのランプが全て光っている信号機はなんの意味もなさないのと同様、すべての神経細胞がフル稼働してもそこに意味はないのです*17

右脳は感覚、左脳は理論を司っている

これは部分的にはあっているのが厄介ですが、基本的には嘘です。
今後の説明で触れていきますが、大脳は左右に分かれているものの様々な処理を分担しているので、右脳はこう、左脳はこうだと一概には言えません。
五感の入力は左右に分かれて入ってきますが、そのあとは次第に混ざり合うように合成されていき、脳の様々な場所に伝搬していくので、左右の脳が異なる処理をしているのは間違いありませんが、だからといって右脳と左脳で明確に目的が異なるわけではありません。

おわりに

今回は脳の概要について広く浅く触れました。次回以降は今回紹介した各部位がどのような役割を果たしているのか、その詳細について見ていきます。

*1:生き物は摂取できる食べ物の量と食事にかける時間に限界があるため、一定以上は脳を大きくできないと考えられる。ところが人間は物を調理することで消化しやすくするということを発明したため、結果的に多くの栄養が摂取できるようになり、脳をさらに大きくすることができた、と考えられている

*2:Macbook Air が 30〜40Wくらい

*3:頭蓋骨と硬膜の間で出血があると硬膜外出血、硬膜とくも膜の間だと硬膜下出血、くも膜と軟膜の間だとくも膜下出血と呼びます

*4:終脳(telencephalon)とも

*5:前頭葉が傷つくことで、料理ができなくなることもある。料理は平行して様々な動作を順番通り進める必要があるので、非常に高度な処理が必要となる

*6:視覚はまず後頭葉で簡単に処理され、その後側頭葉と頭頂葉に二手に分かれるようにして処理が進む。側頭葉は見たものが「何か」、頭頂葉は見たものが「どう動いているか、どんな場所にあるか」を処理していると考えられている

*7:一口に記憶と言っても様々な種類があり、海馬は特にエピソード記憶に関与している

*8:乳頭体は大脳辺縁系の一部として扱うときと、中脳の一部として扱うときもあるが、ここでは間脳の構成要素としている

*9:狭義の間脳として、視床視床下部のみを指すこともある

*10:デカルト松果体が脳の中心にあることから、ここが精神の中枢であると予想していました

*11:ただし、黒質大脳基底核の一部とされることのほうが多い

*12:Azevedo FA, Carvalho LR, Grinberg LT, Farfel JM, Ferretti RE, Leite RE, Jacob Filho W, Lent R, Herculano-Houzel S. Equal numbers of neuronal and nonneuronal cells make the human brain an isometrically scaled-up primate brain.(2009) J Comp Neurol. 10;513(5):532-41

*13:昔は1000億個ほどと言われていたが、最近は800〜900億個くらいだと見積もられているようだ

*14:部位によって割合が異なるが、むしろ神経細胞のほうが多い部分のほうが多い

*15:Azevedo FA, Carvalho LR, Grinberg LT, Farfel JM, Ferretti RE, Leite RE, Jacob Filho W, Lent R, Herculano-Houzel S. Equal numbers of neuronal and nonneuronal cells make the human brain an isometrically scaled-up primate brain.(2009) J Comp Neurol. 10;513(5):532-41

*16:この「少数の神経細胞だけが活動する」という点は省エネルギーというだけでなく、情報処理にとって非常に重要な役割を果たしている。これは今ではスパースコーディングと呼ばれているが、この理論については後日詳しく解説する

*17:同じ処理をするのに、よりたくさんの神経細胞を活動させないといけないような個体がいた場合、エネルギーを無駄に喰うため淘汰されると考えられる(簡単に言えば餓死しやすい)。そのため進化の過程ではより少ないエネルギーでより複雑な処理ができるような神経系を持つ個体が生き残ってきたとも考えられる

知能と技術的特異点

これは 人工知能アドベントカレンダー の1日目の記事です。

はじめに

アドベントカレンダーは25日間をかけて、知能、あるいは人工知能(あとで触れますが、正確には汎用人工知能を指す)について、それを理解しまた実現する技術について、広く浅く解説と紹介をします。

ここでいう人工知能は、後述するように一般に考えられている人工知能(Artificial Intelligence) ではなく、汎用人工知能 (Artificial General Intelligence, AGI) であり、一言で表すなら、「人と同じような知性をもった機械」を考えます。ただし、以降は特に断りのない限り、AGIの意味で単にAIといいます。AIとAGIの違いについては、以前の記事
人工知能は Deep Learning によって成されるのか? - Sideswipe を御覧ください。こちらは今回のシリーズで扱う内容の概要としてもお使いいただけます。

知能とはなにか

知能は、一般に、抽象的思考、理解、自己の認識、他者とのコミュニケーション、学習、計画、記憶、創造と問題解決ができること、などによって定義されます。

人工知能とはなにか

人工知能は、その字面のとおり、知能(を持つなにか)を人の手で作ろうという試みです。
ここでの人工知能は、"真の"人工知能 (強いAI ≒ AGI)であることに注意してください。逆に言えば、弱いAIは既に十分に実用化されています。
たとえば、

  • チェスをする
  • 顔認識をする
  • 線形代数微分積分の複雑な計算をおこなう
  • クイズに答える
  • 文字や声を認識する

などといったことは、すでにコンピュータ≒電子計算機(や階差機関)によってなされていますし、人間を超えたパフォーマンスを発揮しているものも多くあります。

人工知能の壁

5歳児にも勝てないチェスロボット?

では、こうした数々の輝かしい実績があるのにもかかわらず、なぜ人工知能を取り扱うのでしょうか?
それは、既存のAIでは決定的にできていない、できない壁が存在するためです。

チェスを例にしましょう。今のチェスプログラムは極めて賢く、1997年には世界チャンピオンのガルリ・カスパロフIBMのディープブルーが勝利しており、人間はどんなに賢い人でもまず勝てません。ところが、チェスのコマを並べたり、持ち上げて移動させたりするのは極めて困難です。5歳の子供でも勝つことができるでしょう *1

最新のロボット工学では、確かに様々なことが出来るようになりました。たとえばASIMOはお盆にお茶を入れて運び、人に渡すことができます。
このために多くの技術者が長い期間をかけてプログラミングを行いましたが、別のことをしようと思ったら(たとえば回収したコップを流しに入れるなど)また新しいプロジェクトが必要になります。

ディープブルーも、チェスでは無類の強さを誇る一方で、将棋はまったくできませんし、他のいかなる問題もできません。人間ならあるひとつのタスクからほかにつながるような一般化ができますが、そのような能力は既存のAIにはありません。

f:id:kazoo04:20151130200328p:plain
IBMのチェスマシン Deep Blue*2 と当時チェスの世界チャンピオンだったガルリ・カスパロフ(Гарри Кимович Каспаров, Garry Kimovich Kasparov) *3

ネズミにも勝てない災害救助ロボット?

もうひとつ例をあげましょう。
DARPA Robotics Challenge は、二足歩行ロボットで災害救助(を想定した競技)を行う大会です。
ここでは、自動車を所定の場所まで運転し、降車し、ドアノブをあけたり、ドリルをもって穴を開けたり、瓦礫の上を歩いたりしなければなりません。


The 2015 DARPA Robotics Challenge Finals - YouTube

このためには、極めて優れたエンジニアが長い期間をかけてプログラミングを行う必要があります。たとえば「ドアノブを開ける」というタスクについて考えましょう。
それには以下の様な手順でプログラムを書く必要があります。

  • 3Dスキャナー(レーダー)でドアノブがありそうな場所の三次元形状を推定する
  • 推定した形状をもとに、最もドアノブに似ている形状のものを探す
  • ドアノブの向きを調べて、つかむために必要な手首の角度を計算する
  • 自身の位置とレーダーの情報を元に、肩からドアノブまでの位置関係を計算する
  • 以上の結果から、肩・肘・手首・指をどのように動かせばドアノブまで手を伸ばせるかを計算する
  • モーターを駆動させる
  • 様々なノイズによって各関節の位置に誤差が出るので、それらを検知する
  • 誤差を打ち消すために必要な動きを計算して、フィードバック制御する
  • 手になにがかぶつかったらそこで動きを止める
  • レーダー情報を解析して、手にぶつかっているものが確かにドアノブだと判定したら、手を握る
  • etc.

ここまででようやく「ドアノブを握る」まで到達しました。もう書ききれませんがこれだけの処理を人が作りこんでいく(=プログラミングをする)必要があります。今回はドアノブがレバーのようなタイプでも、丸いタイプだったらまた修正が必要です。ボタンを押して開く自動ドアだったらまた修正が必要です。気が滅入りますね。


A Celebration of Risk (a.k.a., Robots Take a Spill)
失敗事例集。最先端の技術を結集しても簡単に転んでしまう。

今の人工知能と我々はなにが違うのか

先日、私の1歳半の息子がクリスマスツリーの飾りが落ちているのを見つけて拾い上げていました。わたしが「もとのところに戻しておいて」と言うと、彼は迷うこと無くクリスマスツリーがあるところにいって適当な枝に飾りをひっかけていました。これは今のロボット工学からすると驚異的な能力です。本来別のところにあるものが落ちていることを認識し、拾い上げ、私の発言から意図を推測し、手に持っているものがクリスマスツリーの一部であることからツリーがどこにあるか思い出し、移動し、適当な場所に設置するだなんて、現在はどんなに賢いロボットでもできません。そもそも障害物だらけの場所をあんなに滑らかに歩行することがまず無理です。

「どうも今のロボットがとってるアプローチは、我々動物とは違うようだぞ?」と思っていただければそれで構いません。人間でなくても、たとえばネズミであっても段差を登っていって迷路を探索してボタンを押して餌をとる、なんてことはあっという間にできますし、一度学習したらちょっとくらい環境が変わってもなんなくこなせます。

そもそも、「不安定な場所を歩いて行き、転倒してもすぐに立てる」レベルのロボットは、最近ようやく Boston Dynamics の Big Dog ができるようになりましたが、こんなものは人間はもちろん、昆虫ですらできるわけです。どうにも今のロボットと動物は、物事の処理の仕方が決定的に違いそうです。

f:id:kazoo04:20151130203058p:plain
現代科学を駆使した最高の技術を結集して作ったロボットも、生まれたばかりの赤ん坊にあっという間に追いぬかれてしまうのはなぜなのか?

従来の人工知能は、ある目的に超特化してそれをうまくすることはできるのですが、動物の知能というものは非常に一般化されていて、どのような状況にも柔軟に対応できるということがわかります。

汎用人工知能

というわけで、今、世間で言われている人工知能は生き物にとって高度だと思われていること(微分積分の計算をする、チェスや将棋をする、etc.)に対しては高いパフォーマンスを発揮している一方で、生き物が簡単な問題(歩く、転がってきたボールを拾う、餌を探す、捕食者から逃げる、会話する、etc.)はまったく歯がたたないという、ある種のパラドックスが発生しているわけです。

そこで、従来の特化型の人工知能とはまったく別のアプローチをとって、動物の知能を模倣しようとする潮流があります。それが汎用人工知能(AGI)と呼ばれるものです*4

どのようにしてAGIを実現するのかはまだあまりわかっておらず、当然AGIはこの世にまだ存在しないわけですが、わかりやすく言えば、映画に出てくる「人工知能をもったロボット」を想像していただければわかりやすいでしょう。たとえば、ドラえもん鉄腕アトムターミネーターのT800, 2001年宇宙の旅HAL9000, インターステラーのTARSとCARS, WALL・Eのウォーリーなどなど…枚挙にいとまがありませんが、それだけ人々が人工知能に対してさまざまな感情を抱いてきたことがわかります。

こういった"本物の"人工知能を作るのが汎用人工知能であり、また本稿の主題でもあります。

技術的特異点

技術的特異点(Technological Singularity) はキャッチーなのでタイトルに入れましたが、特にこのテーマを主眼に置いて記事は書きません。
技術的特異点は、人間と同等以上のAGIが生まれたときに、そのAGIがさらに洗練されたAGIを自ら設計し、そうして生まれたAGIがさらに洗練されたAGIを設計し…というプロセスがひとたび始まると、知能が爆発的に上昇し、人間が置いて行かれるようになるある瞬間のことをいいます。
もっとも、技術的特異点が発生するための条件として、AGIが存在するわけですから、本シリーズは「技術的特異点を起こす方法」とみなしてもよいでしょう。

f:id:kazoo04:20151130204802p:plain
技術的特異点を説明した図(正確なものではなく、あくまでも特異点が意味するところを想像してもらうためのイメージ)。人工知能が次第に賢くなっていくといつか人間を超える瞬間があり、それ以降は人工知能が加速的に賢くなる知能の爆発が起きる、といわれている。時間軸の「2015年」は便宜上設けたものであり、縦軸横軸ともに正確な意味はない。横軸の始まりの部分は、(人類誕生ではなく)生命が知性を獲得した瞬間、と考えていただきたい*5

本シリーズの流れ

AI(繰り返しますが、以降はAGIの意味で人工知能あるいはAIと言います)の説明をしていくうえで、まずは「どうすれば人工知能が作れるか?」を考えましょう。
大きく分けると、ふたつのアプローチがあります(詳しくは 人工知能は Deep Learning によって成されるのか? - Sideswipe を御覧ください)。

ひとつは、トップダウンのアプローチです。つまり、数学の問題を解く、音声認識をする、顔認識をする、チェスをする、会話をする、などといった知能がもたらす高度な振る舞いをひとつひとつ観察・模倣していって、網羅的に知能的な振る舞いを実現していく方法です。これに従うならば、人間ができることをひとつひとつ丁寧にプログラミングによって再現していくことで、いつか人間と見分けがつかないような振る舞いをするロボットが作れる、というわけです。

もうひとつは、ボトムアップのアプローチです。脳は様々な部位から構成されており、またそれぞれの部位はさらに細かい神経の集まりによって構成されており、神経の集まりの中を見るとさまざまな神経細胞が複雑に繋がっており、さらには各神経細胞は化学的・電気的なふるまいによって動いています。これらを生理学的に調べていき、コンピュータ上に再現すれば、(十分にうまく再現できれば)知的な振る舞いをするプログラムが作れるはずです。

前者はすでに様々な分野で成果を上げている一方で、後者は考えただけでも気が滅入りそうです。そのため注目を集めやすいのはやはり前者のトップダウン的なものですが、モラベックのパラドックスといって、高度な知性が必要な物は簡単なのに、昆虫や爬虫類でもできるような振る舞いは難しい(つまりチェスのAIはすぐできたが、森を歩きまわるロボットは極めて難しい)という問題もあるので、ボトムアップ的なアプローチも必須だと考えられています。

もちろん、その中間くらいの部分からのアプローチも有効でしょう。

f:id:kazoo04:20151008201638p:plain

人工知能を実現する2つのアプローチ。知能がなす高度な振る舞いの模倣から始める(トップダウン)か、生き物が共通して持っている神経基盤を明らかにしていくか(ボトムアップ)が考えられる。実際にはこの2つの協力・融合が必要になる。

そこで、本シリーズでは、まずボトムアップで、つまり個々の神経細胞の振る舞いや、脳の各部位がどのような機能を持っているのかについて見ていきます。次に中間的なアプローチ、つまり心理学などによって動物の振る舞いから得られたデータを元に推測される脳の仕組みについてご紹介します。
最後にトップダウンのアプローチによって、機械学習(みなさんがお好きなDeep Learningも!)やコンピュータによる脳の各機能のシミュレーションについて触れます。

本シリーズで気をつけること

生理学に近づき過ぎない

今回は、AGIという題材を扱うことから、当然脳の仕組みについて触れますが、適度な粒度で扱うことにし、細部については省略します。
これは、文量が多くなりすぎて25日ではとても扱いきれないという点もありますが、必要以上に細かいところを見てもAGIの実現という目的からは逸れてしまうと考えるからです。プログラミング言語を作るときにトランジスタの電子の流れを説明することがないように、グライダーを作るときに鳥の羽毛の構造を勉強することがないよう*6に、今回もあまりにも細かい部分、たとえばニューロンが発火するときのナトリウムイオンの挙動については触れません。

(旧来の)人工知能には触れない

Support Vector Machine (サポートベクタマシン)や、Random Forest(ランダムフォレスト)、またDeep Learning(ディープラーニング)などの機械学習アルゴリズムや、ゲームのAI、車の自動運転技術などには触れません*7。これは一般にAIと呼ばれる分野ですが、すでに述べたようにこれらは人間の知性をコンピュータに再現するという汎用人工知能とは異なる技術です。今よく言われているAIと、AGIがかなり違うものだということはここまで読んだみなさんならよくお分かりかと思いますが、本シリーズをすべて読んでも、チェスをするソフトウェアや、二足歩行ロボットが作れるわけではありません。

クオリアに触れない

今回はクオリアには触れません*8。知りたい人はインターネットで検索してください。

機械論を前提にする

ここでは、脳は完全に物理法則の範囲内で動作しており、意識や心も今はわかっていないだけでいつかは理論的に説明可能であるという前提で説明します*9
つまり、「科学では絶対に説明不可能な存在(たとえば霊魂)が存在して、それが肉体に働きかけることで我々に意識や心が生まれ、身体を動かすのだ」という二元論的な話はしません*10

イラストはなるべく自作

わかりやすさのため、なるべく多くの挿絵を使っていく予定ですが、基本的に自作することにします。本シリーズでは、出典の明記がない場合、すべて著者の自作です。
一通り終わったら、加筆修正をしたのち*11、適当なライセンス(おそらくPublic Domain)で公開して、スライドやウェブページで自由に使えるようにしようと考えているからです*12。他の人がAGIを語るとき、挿絵としての選択肢が少しでも多くなればと思いこのような方針にしています。

なるべく英語で併記する

専門用語は、初出時には可能な限り英語表記も紹介します。これは、読者が脳科学に興味を持ったときにウェブページや論文の情報に触れやすくするためです。
日本語の文献だけだと英語表記がわからないため、論文を読むときに逐次翻訳しなければならず、非常に大変です。そのような労力はみなさんがする必要はないと考えます。

次回にむけて

日本語のウェブページや書籍では、先の図の上から下まで一気通貫で解説した物が少なく、また情報源が非常に古かったり、偏っていたりして、「人工知能を実現するために必要な情報」をまとめたものがないために執筆を決めました。
数学、情報工学、脳科学、神経生理学、心理学を織り交ぜながら広く浅く解説・紹介をしていく予定なので、以後お楽しみに。

*1:Daniel Wolpert の講演から引用

*2:James the photographer - http://flickr.com/photos/22453761@N00/592436598/ (CC BY 2.0)

*3:Copyright 2007, S.M.S.I., Inc. - Owen Williams, The Kasparov Agency. - http://www.kasparovagent.com/photo_gallery.php (CC BY-SA 3.0)

*4:従来のAIを、古き良きAI(Good Old-Fashioned Artificial Intelligence, GOFAI)と呼ぶことがあるようですが、本稿では用いません

*5:人間(ホモ・サピエンス)は誕生以来ほとんど知能は変わっていないと思われる。このグラフの赤い線はかなり楽観的な傾きであって、実際は残念ながらほぼ平らである

*6:言うまでもなく、空を飛ぶときに鳥の骨や羽を研究することは有用だが、今回はわかりやすい例えとしてご容赦いただきたい。動力飛行発明までに多くの人が「羽ばたく」ことに固執して失敗していったように、空を飛ぶために最小限必要なものは何か?を考えるのと同様、人工知能も実現するための最小限の理論があるはずで、そこからさらに発展させていくという意味では脳の非常に細かな機能や挙動にも注意を払っていく必要があるだろう

*7:Deep Learning とニューラルネットワークについては、若干触れる予定

*8:クオリアの説明をするとそれだけでかなりの文量が必要になるという理由と、客観的に観測する方法がわかっていないため、ここで論じても意味が薄い、という理由

*9:機械論的唯物論唯物論

*10:二元論を否定するわけではありませんが、「知性には霊的な存在が必ず必要である」と仮定すると、本シリーズの意味がなくなるため、機械論を前提にしないと以降の話が成り立たない

*11:間違いがたくさんある前提

*12:SVGの予定ですが、他の希望があればお願いします