読者です 読者をやめる 読者になる 読者になる

Sideswipe

情報工学、計算論的神経科学など、真面目なこと書くブログ。お仕事の話は Twitter: @kazoo04 にお願いします。

五感

これは 人工知能アドベントカレンダー の7日目の記事です。

今回のテーマは五感ですが、視覚、聴覚、体性感覚(触覚)の3つをメインに触れます。ロボット的には嗅覚と味覚センサは一般的ではないですしね。

視覚

視覚は非常に複雑なプロセスで処理されており、脳の大部分(ある種の猿は大脳皮質の7割)は視覚処理をしています。
まず、光が目に入ってから視覚野までの経路を簡単に説明します。

f:id:kazoo04:20151124233304p:plain
視覚伝導路

網膜とサッケード

左右の目に入った光が網膜の錐体細胞*1・桿体細胞*2を刺激し、視覚刺激は視神経を通って視交叉を通過します。

網膜では視神経が通る部分には錐体細胞・桿体細胞ともに存在しないため、たとえ光が入ってきても情報が入ることはありません。これは盲点と呼ばれます。
また、それぞれの眼球中央よりすこし外側の網膜にはわずかに凹んでいる場所があり、中心窩と呼ばれここには非常にたくさんの錐体細胞があります。逆に言うと、中心窩からすこしでも離れると錐体細胞の数はどんどん減っていき、視野の端のほうには錐体細胞はほとんど存在しません。中心窩の大きさは、腕を前にまっすぐ伸ばし、親指を立てたときの爪の大きさくらいですが、そこ以外の部分は実はほとんど見えていないのです。

そのため、ヒトの目は見たいものを中心窩で捉えるために1秒に2, 3回ほどの頻度で常に目を動かしており、サッケード(saccade, 眼球跳躍運動、サッカードとも)と呼ばれます*3

f:id:kazoo04:20151201010401p:plain
サッケードとマイクロサッケード。点線で示した円が注視目標で、被験者はこの円をずっと見るように依頼される(実際の円はもっとずっと小さい)。被験者はまったく目を動かしていないつもりでも、実は常に小刻みに動いており、通常止まることはない。この動きはいくつかの種類にわけられる。ひとつは別の点にジャンプするように瞬時に移動するマイクロサッケード(フリックともいう)。もうひとつがドリフトとトレマであり、ドリフトは弧を描くように滑らかに移動していく動き、トレマは非常に小刻みに振動するような動きで、この2つが組み合わさって図で示したような動きになる*4

1秒に2,3回というのは相当な頻度ですが、そこまで目を動かしている感じは普段はしません。この理由はまだ不明な点も多いのですが、大雑把に言うと、目を動かすときにその動きを打ち消すような処理をしているため、サッケードが発生しても見ているものが動くようには感じられない、というわけです。

サッケードに関しては様々な研究があり、非常に奥が深いのですが、眼球運動をまじめに扱うとまた1日ぶん記事が増えるので、適当に割愛します*5

視覚伝導路

視交叉ではそれぞれの眼球の右視野と左視野の入力が交叉しており、右脳には左視野の、左脳には右視野の情報だけが送られます*6

そして、

  • 中脳の上丘に投射する経路
  • 外側膝状体(LGN)を経由して大脳の後頭葉にある一次視覚野(V1)に送られる経路

の2つの主要な経路に別れます*7

f:id:kazoo04:20151201011930p:plain
左は実際に見ているもの(あるいは見ていると感じているもの)であり、右は目が受け取っている情報をイメージしやすいように加工したもの(正確性は多少犠牲にしている)。
網膜に映るのはレンズを通しているため上下左右が反転しており、また中心部分には網膜神経節細胞が極めて多い中心窩が存在する。逆に言えば、人は視野の中心しかほとんど見えておらず、外側に行くに従って解像度が落ちると同時に色に対する感受性も低下する。そのため、常に眼球を動かして中心窩で捉える部分を変えていかなければならない。右図で中心よりすこし左にある灰色の円は盲点であり、この部分の情報は完全に欠落するが、脳内で補完されるために通常気づくことはない*8

視覚野

視覚野はある程度並列処理をしているものの、階層的な処理もしており、一次視覚野からスタートして次第に広がっていきまた特定の領野に収束していくという菱型構造になっています。

f:id:kazoo04:20151007192417g:plain
猿の視覚情報伝達経路。一番下のRGCは網膜、LGNは外側膝状体、V1から大脳新皮質(視覚野)で、おおまかに言うとV3あたりまでが後頭葉、その後はV4〜AITあたりの経路は側頭葉、MT野以降の経路は後頭葉に位置する。*9

視覚野(視覚野以外の領野も)は受容野というものがあり、たとえば視覚野では、あるニューロンは目に入ってきた映像のごく一部の部分のみを担当しています。受容野内の刺激が特定のもののときのみそのニューロンは発火します。
一次視覚野では、受容野内に特定の傾きの線(エッジ)があるときだけニューロンが発火します。たとえば、あるニューロンは10度傾いた線にのみ反応し、その近くにある別のニューロンは、20度傾いた線にのみ反応し…といった具合です*10

一次視覚野については、過去の記事を参照してください。

f:id:kazoo04:20131217175228j:plain
一次視覚野のモデル図。1〜6の数字は大脳新皮質の6層構造を、R, Lは右目と左目どちらからの入力が投射されているか、縦長の各ブロックはマイクロカラム、円柱のような構造はブロブ、カラムの横に小さく描いてある棒はどの角度の線に対してそのカラムが反応するかを表したもの*11 *12

f:id:kazoo04:20151201013047p:plain
目で見たものがどのようにV1に投射されるかを表した図。左は見る対象、右はV1にどのように投射されるかを表した。右半球の一次視覚野を切開して平面的に広げると右図のように映像が投射されている。右半分しかないように見えるが、既に述べたように右視野と左視野は別々の半球で処理されるためである。局所的な位相関係はある程度保たれているが、全体的に歪んだ状態でV1に投射されることがわかる。また、視野の中央付近の映像はV1の広い範囲で(拡大されて)処理されることがわかる。逆に視野の外側の映像はV1では狭い面積しか割り当てられていない。

上の図でもわかるように、ゆがんではいるものの一次視覚野でも網膜に写った像と同じ位相関係が保たれています。これをレチノトピー(retinotopy)と呼びます。言い換えると、一次視覚野で近くにある神経細胞は、視覚的にも近くにある範囲の処理を担当しています。この処理する範囲のことを受容野と呼びますが、受容野自体は一次視覚野以降の視覚野でも観察されます*13

二次視覚野(V2)では、一次視覚野から入力を受け取って、今度は複数の線を組み合わせたコーナー(角)などに反応するニューロンが現れます。四次視覚野(V4)は二次視覚野から情報を受け取って、さらに複雑な模様や色のパターンに反応するニューロンが現れます*14

このように、ひとつ前の(低次の)領野の入力を受け取って、なんらかの処理をしてより高次の領野に送るといったことをしているのは、視覚野に限らず大脳新皮質全体にいえる普遍的なしくみのようです。

腹側皮質視覚路

f:id:kazoo04:20151119013747p:plain
腹側皮質視覚路を示した図。LGNは視床の一部である外側膝状体(Lateral geniculate nucleus)である。V1は単純な線しか認識できないが、TE野では顔や手などの非常に複雑な形状の物が認識できていることがわかっている。このように、段階を踏んで次第に複雑な情報が扱えるようになっているのが視覚に限らず大脳皮質の基本的な仕組みだと考えられている。V4は本来脳の内側にあり、外からではほとんど見えないが、この図ではかなり誇張して描いてある。(再掲)

腹側皮質視覚路は、実験がしやすい(解釈しやすい)ことから大脳新皮質の中でも特によく解明が進んでいる部分です。
腹側皮質視覚路は、俗にWhat経路といい、目で見たものが何かを処理していると考えられています。つまり、りんごを見てそれがりんごであると判断する部分が腹側皮質視覚路(のIT野)になります。次で述べる背側皮質視覚路は、Where経路であり、どこにあるか?どう動いているか?を処理していると考えられています*15

既に述べたように、視覚野は段階的に複雑なものを処理するようになっており、V1では単純な直線とその傾きにしか反応しません。IT野になると、かなり具体的なオブジェクトに反応するニューロンが見つかっており、たとえば顔に反応するニューロンや、自動車に反応するニューロンや、さらに具体的な例としてシドニーのオペラハウスだけに反応するニューロンなどが報告されています。

背側皮質視覚路

f:id:kazoo04:20151126010327p:plain
背側皮質視覚路を示した図。V2までは腹側皮質視覚路と同じだが、その後経路がわかれて頭頂葉に向かって進んでいく。V3野のあとはさらに枝分かれし、体性感覚野の隣、IPLとSPLに到達する。V3野以降の経路がどうなっているのかはよくわかっていない点が多いが、両者は完全に分離しているわけではなく、少ないながらも相互に連絡をとっているようである。この点は腹側皮質視覚路を含め、大脳新皮質全体に共通している。すなわち、ある領野と別の領野との間にまったく接続がないというのは少なく、大抵は大なり小なり双方向の接続がある場合が多い。

聴覚

f:id:kazoo04:20151125003141p:plain
聴覚野の場所。濃い色で表示されている場所が一次聴覚野。二次聴覚野は一次聴覚野を囲むように存在し(ここでは図示していない)、その外側は聴覚連合野(薄い色で示した部分)。

聴覚野も視覚野同様複数の領野から構成されます。
現在はサルを対象とした研究で、17の領野に分類されますが、視覚野ほどには解明は進んでいません。各領野の機能はもちろん、それぞれがどのように接続されているのかもよくわかっておらず、ここでも簡単な紹介のみに留めます。

聴覚入力は一次聴覚野(A1)で処理されたあと、一次聴覚野を取り囲むように存在する別の聴覚野に出力されていきます。
各聴覚野に共通の構造として、ある小領域は特定の周波数の音だけを専門で処理しており、そこからほんの少しだけ離れた部分では、わずかに違う周波数の音を処理している、と考えられています。つまり、どの聴覚野を見ても、低周波数〜高周波数までを処理する専門の部分が均一に分布しています。これを周波数地図(トノトピー)といいます*16*17

体性感覚

体性感覚は、五感で言うところの触覚にあたるものです。
感覚器からの信号は脊髄を通って、他の感覚同様まずは視床に入力されます*18

f:id:kazoo04:20151206223445p:plain

視床からは主に一次感覚野に情報が転送され、ここで体性感覚の処理*19が行われます。ブロードマンの脳地図でいうと、1,2,3野にあたります(前から3,1,2の順)。さらに二次体性感覚野(43野)に情報が転送されます。

また、体性感覚野と平行して、視床から島皮質(insular cortex)にも投射があることがわかっています。島皮質は脳の奥、側頭葉と頭頂葉を繋ぐ場所にあり、具体的な機能はわかっていないものの、様々な部分で重要な役割を果たしていると考えられており、今後目が離せない領域です。体性感覚の側面から見ても、島皮質は痛覚との関連性が指摘されています*20

f:id:kazoo04:20151206224124p:plain
ペンフィールドホムンクルス。左は体性感覚野、右は運動野。図の上が頭頂で、皮質に沿って体のどの部位が対応しているかを表している。イラストの大きさはどれくらい脳の表面積が割かれているのかを表す。

ホムンクルス

視覚にレチノトピー、聴覚にトノトピーという、似た入力は脳内でも似た場所にあるという関係について触れましたが、一次感覚野においても体部位再現(ソマトトピー, somatotopy)があります。上の図がソマトトピーを表現したもので、ペンフィールド*21ホムンクルス(cortical homunculus)と呼ばれます。

このイラストでは、脳の各部位によって身体の担当箇所が異なること、身体の物理的な位置は概ね脳内でも似たような位置関係にあること(鼻と唇は近い、各指同士は近い、頭と脚は遠い領域で処理されている、など)また身体の実際の表面積・体積とは関係なく感覚が鋭い部分に多くの脳の面積が割かれていることなどがわかります。たとえば、腕や脚は実際の物理的な大きさの割にはほんの少しの領域しかマッピングされておらず、逆に唇や人差し指は身体の1%未満しか占めていないのに、脳内ではかなりの神経細胞がこれらの感覚の処理を受け持っているようです。物を触覚のみで判断するとき、足や背中で触れるよりは、手指を使って触れたほうがずっと細かい形状を把握することができますが、これはホムンクルスの図が表しているように、脳内でたくさんの神経細胞が処理に関わっているからだと考えられます*22

それぞれの感覚野の間は?

一次視覚野や一次聴覚野のような、身体入力が入ってくる部分を感覚野といい、そうでない部分を連合野といいます。連合野は感覚野あるいは低次の連合野から入力を受けて、高次の処理を行ってさらに別の連合野への入力をしていると考えられています。

VIP野

Ventral IntraParietal Area は視覚野と一次感覚野の間あたりにあり、その両方から入力を受けていることから、物理的な位置と視覚情報の両方が必要な処理に関わっていると考えられています。
たとえば、飛んでくるボールをキャッチしようとしたときは、視覚情報からボールの軌道を推測して腕を伸ばす必要がありますが、現実世界が3次元なのに視覚情報は2次元のためほとんどの情報は失われています。そのために視覚情報から元の3次元の世界を復元することは理屈上不可能*23です。しかも、身体感覚は視覚とはまったく異質な入力ですから、この必要な情報が揃っていない上に入力の性質も異なるような情報を統合させる必要があります。VIP野周辺では、うまいこと視覚と体性感覚の両方を処理して、このような問題を解いている、と考えられています。

言語野

先日触れた、言語野の一部であるウェルニッケ野や角回は、聴覚野と視覚野と感覚野に囲まれたような位置にあります。これも、たまたまこの位置が空いていたから配置されたわけではなく、それぞれの感覚をすべて統合することによって実現されていると考えられます。

このように、感覚野は比較的入力がはっきりしていることからその機能も調べやすいのですが、特に高次の連合野になると様々な入力が処理されたものが複雑に絡み合ってくるわけです。そのため「こういった作業をすると活動が活発になる」という相関はわかっても、具体的に「◯◯が入力で、◯◯という処理をして、◯◯という出力をする」と言葉では言い表せないようなものになってきます。

さいごに

今回は、視覚・聴覚・体性感覚を中心に解説しました。既にお分かりの通り、視覚だけは他とくらべてかなり研究が進んでおり、今回はご紹介できなかった興味深いことが山のようにありますが、割愛させていただきました。他の感覚に関しても今後の発展が望まれます。

どの部位に関しても、似たような入力は脳内の似た場所で処理されているようです*24。一口に感覚といっても視覚、聴覚、皮膚感覚はまったくその性質が異なるように思われますが、このような共通する構造が見られるということは、このような位相関係を維持すること自体になにか重要な役割があるのかもしれません。このあたりについては、後日すこし触れることにします。

*1:赤・青・緑の色にそれぞれ反応する

*2:光の明暗に反応する

*3:さらにマイクロサッケード(micro saccade, 固視微動とも)というものもあり、マイクロサッケードはさらにドリフト、トレマ、フリックという3種類の動きに分類される

*4:マイクロサッケードあるいは固視微動は、ドリフト・トレマ・フリックをまとめて言うときと、フリックのことだけを指すときがあり用語に若干混乱がみられる

*5:サッケード、マイクロサッケードともにどういった機能があるのか、どのように実現されるのかについては謎が多い。サッケードの主要な目的は、解像度の中心窩でものを捉えることである。マイクロサッケードは網膜像を鮮明に保つために必要だと考えられているが、どれくらいノイズが寄与しているのか、ドリフト・トレマ・フリックそれぞれの機能についてはよくわかっていない

*6:図を見て「右脳には右視野の、左脳には左視野の情報が入るのでは?」と思ったかもしれない。目に入ってきた像は上下左右が反転していることに注意。

*7:上丘を介して高次視覚野に伸びる経路もわずかながら存在する

*8:盲点が発見されたのは1660年であることから、何百万年もの間、「目には見えていない部分がある」ということに誰も気づかなかったことになる

*9:Felleman, D. J. & Van Essen, V. C. (1991) Distributed hierarchical processing in primate visual cortex.

*10:ここでは「線」といっているが、実際は線というよりは波のほうがよく表せる。特にガボールフィルタでよく近似できることは古くから知られている

*11:Livingstone and Hubel, J. Neurosci. 4, 309-356, 1984

*12:ただし、実際にはこのような縦横方向へ整然と並んでいるわけではなく、どちらかというと渦巻き状に似たコラムが並んでいることがわかっている

*13:ただし受容野のサイズは次第に大きくなっていくことが知られている

*14:昔はV4で初めて色の処理を行うようになると思われていたが、今ではV1に存在するブロブという構造でも色を処理することがわかっており、従来考えられていたよりV1の段階でも比較的複雑な処理をしているとされる

*15:今ではより広範な処理に関わっているとされる。たとえば、把持機能(物をつかむ)との関係など。物をつかむときは対象の形状にあわせて手首を回転させたり手を開いたりしなければならないが、この処理に背側皮質視覚路が重要だという意見がある

*16:似た位置にある領域では似た周波数の音を処理していると書いたが、実は最近になって間違いかもしれないと指摘されています。研究では、ネズミの聴覚野を詳しく調べた結果、ある周波数を処理する部分は領野内にバラバラに存在しており、たとえば低い周波数を処理しているすぐ近くに高い周波数の音を処理している部分があったりする

*17:Bandyopadhyay et al. Dichotomy of functional organization in the mouse auditory cortex. Nature Neuroscience, 2010

*18:脊髄のどの位置を通るか、視床のどこに入力されるのかは体の部位と感覚(痛覚、温度感覚、etc.)によって変わる

*19:具体的に何をどう処理しているのかはあまりわかっていない

*20:AD Craig. Interoception: the sense of the physiological condition of the body. Curr. Opin. Neurobiol.: 2003, 13(4);500-5

*21:Wilder Graves Penfield (1891-1976) はカナダの脳外科医。てんかん治療の際に、脳を電気刺激すると様々な感覚を呼び起こせることを発見した

*22:これを見ると実に体性感覚野の半分程度は首から上の処理に割かれていることがわかる。異物を食べないようにすることや、話すことがヒトにとって非常に重要な役割を果たすからだろう

*23:このように、問題を解くのに必要な材料が足りないために正しい解が決定できないような問題を、不良設定問題という

*24:聴覚は既に脚注で触れたとおりちょっと怪しい