トップページ > 産業・雇用 > 中小企業支援・海外ビジネス支援 > Culture,Research,Industry "Global Hub KYOTO" > 知の京都- 西田知史さん(国立研究開発法人情報通信研究機構(NICT) 脳情報通信融合研究センター(CiNet) 主任研究員/博士(医学))

ここから本文です。

知の京都- 西田知史さん(国立研究開発法人情報通信研究機構(NICT) 脳情報通信融合研究センター(CiNet) 主任研究員/博士(医学))

産学公連携、産業振興の一環として、京の研究者・専門家の皆さんを紹介するページです。

知の京都 京都府の産業支援情報

次世代脳情報基盤技術「脳の知覚情報処理の数理モデル化」

(掲載日:令和元年6月6日、聞き手・文:ものづくり振興課 足利)

西田先生

国立研究開発法人情報通信研究機構(NICT)脳情報通信融合研究センター(CiNet) 主任研究員/博士(医学)の西田知史さんにお話をおうかがいしました。

脳の知覚情報処理の数理モデル化

―先生は何の研究をなさっているのですか?

西田) 「知覚情報」と「脳内情報」の複雑な対応関係を「数理モデル」化することで脳内の情報処理のメカニズムを定量的に理解するための研究を行うとともに、その成果を人工知能やビジネスへ応用するための研究にも取り組んでいます。

 

研究概要

―難しそうですね。数理モデル化ですか。

西田) 日常環境で人間が目や耳を通して受け取る情報(知覚情報)は、例えば視覚だけに注目しても、とても複雑な情報を含んでいます。その中から、脳は効果的に情報を取り出して、適切な認知や行動を実現しています。これは、脳が非常に優れたアルゴリズムを持っていて、効率的に情報を処理していることを意味しています。そのような優れた情報処理のアルゴリズムを理解することが、私たちの研究の大きな目標なのですが、単純には理解できないんです。なぜなら、脳に入ってくる知覚情報から、脳活動として表現される脳内情報を生成する脳の中の情報処理を、私たちは直接観察することができないからです。そのため、脳の中の情報処理アルゴリズムに対して、妥当な仮説を立てて検証する必要がありますが、私たちはそれを数理モデル化によって行っています。

―なるほど。だから、脳を数理モデル化するのですね。

西田) 脳が行う知覚情報の処理は、情報が脳内の回路を流れる中で、順を追って情報から特徴を抽出していく過程と考えることができます。例えば視覚では、眼球から入ってきた視覚情報は、脳の後部の初期視覚野と呼ばれる領域に送られ、そこから前方へと順に処理されながら送られていきます。その過程で、動き・位置に関する情報については「背側経路」で特徴抽出され、物体・意味に関する情報については「腹側経路」で特徴抽出されるといった具合に、様々なレベルの特徴抽出が行われ、情報が処理されていきます。数理モデル化は、そのような様々なレベルの特徴抽出を、数理モデルで個別にシミュレートすることを目的にしています。

脳イメージ

―十分理解できてないかもしれませんが、「知覚情報」「脳(知覚情報処理)」「脳内情報」の流れのイメージが、なんとなく分かった気がします(笑)。しかし、「脳内情報」というのは、データとして存在するのですか?

西田) それは、脳活動に含まれています。そして、脳活動のデータはfMRIとか、EEGとか、いろいろな手法により計測できますよね。

―ああ~、そうですね。

西田) 私の研究では、fMRIを用いています。脳内情報、つまり、脳活動というのは、最小単位はニューロンで生じる電気的活動です。ニューロンが集団で活動すると酸素が必要になり、血流量に変化が生じます。fMRIはその血流量の変化を測れます。ご承知のとおり、MRIは、強い静磁場の環境で頭や体にパルス状の電磁波を当て、返ってきた信号を計算、画像化する装置です。血中には反磁性体のヘモグロビンがありますが、神経活動に必要な酸素を手放した後の「脱酸素ヘモグロビン」は常磁性体になり、脱酸素ヘモグロビンが増加するとMRIの信号の減衰が早まります。その減衰の度合いを見ることで、脳の活動度を測ることができます。 

―そうなのですね。

西田) fMRIは、非侵襲(身体を傷つけない手法)であり、空間的な計測の精密度も高いことから、これを選びました。MRIの計測単位は、1辺が1mm〜3mm程度の立方体または直方体で、ボクセルと言います。カメラで撮影したような2次元画像ではピクセルですが、MRIで撮影した3次元画像ではボクセルです。MRIの装置の中で、被験者の方に様々な映像を見ていただいて、その際の、脳の活動データをボクセル単位でとるわけです。

脳内情報の可視化

―なるほど、そうした「知覚入力」データと「脳内情報」データから、「数理モデル」を導き出すということですね。深層学習のような手法で、ですか?

西田) そうです。深層学習のような機械学習で用いられる特徴空間などを数理モデルとして組み込み、脳の知覚情報処理をシミュレーションします。そして、知覚入力から数理モデルを介して脳活動を予測するモデルを作成します。私たちはこれを「符号化モデル」と呼んでいますが、その予測の性能によって、数理モデルがどれくらい脳の情報処理を表現できているか、その妥当性を評価します。また、同じ数理モデルを応用して、脳活動から数理モデルを介して知覚情報を復元・解読するための「復号化モデル」も作成できます。

研究概要その2

―符号化・復号化モデルの例にはどういったものがあるのですか。

西田) 例えば「視覚情報処理の可視化」ですね。その具体例で言いますと、「視覚像の再構成」といった研究がなされています。人が見ている画像を、脳活動から、逆に再構成するというものです。

(参考)先行研究例 https://www.youtube.com/watch?v=nsjDnYxJ0bo

―うわー、すごいですね!実際に見ている画像にかなり近いですね。おもしろい!

西田) あるいは「意味情報処理の可視化」、例えば「言葉による脳内意味表現の可視化」といった研究があります。世界には様々な意味を持った物体や動作のカテゴリ(例:男性、猫、走る)が存在するのですが、それら無数に存在する意味カテゴリが、どのような関係性を持って脳内で表現されているかを、数理モデル化によって可視化した研究です。可視化した意味カテゴリの表現空間を「脳内意味空間」と呼んでいますが、そこから人間の意味認知の特性について色々と面白いことが示唆されます。例えば、意味カテゴリを表現の近いものでグルーピングすると「人間」「動物」「乗り物」といったグループができるのですが、生物学的には人間も動物に含まれるのに、脳内では、人間と動物は人間と乗り物と同じくらい離れて表現されています。もしかしたら、人間は自分たちを動物のくくりに入れずに特別視しているのかもしれない、といったことが暗示されます。

―脳を見ることでそういうことがわかるのですね。おもしろい。

西田) はい、そして、もちろん脳内意味空間には個人差があります。この個人差が知覚における「個性」をもたらしているのではないかと思っています。現在私は、この脳内意味情報表現の可視化を用いて、双子の方や精神疾患を持った方を対象に、個性をもたらす脳のメカニズムを調べる研究にも取り組んでいます。

―なるほど。

西田) 私は近年、意味情報処理の可視化をさらに精度良く行うために、「word2vec」という工学分野で開発されたアルゴリズムを使った数理モデル化にも取り組みました。Word2vecは、大量のテキストデータを解析し、各単語の意味のベクトル表現を獲得するための手法です。単語をベクトル化することで、単語同士の意味の近さを数値で表したり、単語同士の意味を算術計算の形で足したり引いたりということが可能でして、例えば、「王様-男性+女性=女王」ですとか「パリ-フランス+イタリア=ローマ」といった計算ができます。これを「意味情報処理の可視化」に利用すると、脳内情報からその人が考えたことを解読して、数万語の単語を使って表現するような、脳内の知覚意味内容の解読ができます。単語には名詞、動詞、形容詞が含まれるので、それらに対応する物体、行動、印象の知覚内容を解読することに成功しました。

(参考)http://www.nict.go.jp/press/2017/11/01-1.html

脳融合型AI

―頭の中で思ってることが、バレちゃう!?(笑) 「ドラえもん」の未来の道具で出てきそうな話で、おもしろいですね!では、AIへの応用には、どういったものがあるのですか?

西田) AIに脳情報を融合することで、AIを強化できるのではないかと考えており、現在、株式会社NTTデータ様と共同で「脳融合型AI」に関する研究を進めています。

研究概要その3

―おお!AIと脳科学の融合!しかし、そのメリットは何ですか?

西田) 私が研究している脳融合型AIでは、深層学習のようなAIモデルの内部表現を使って、視聴覚入力によって生じる脳活動を予測したうえで、予測した脳活動から知覚内容を解読します。これによって、復号化モデルを用いた脳解読のための脳計測をほぼ不要にします。したがって、1つ目のメリットは、いちいち脳活動を測定しなくても脳解読ができる点です。また、AIモデルの内部表現を一旦脳活動に変えてから知覚内容の推定を行うことで、AIモデルの内部表現を脳情報で強化するはたらきもあります。これによる2つ目のメリットが、AIモデルを用いた知覚推定の性能を、脳融合によって高めることができる点です。私が研究中のものでも、「普通の脳解読」、「AIだけ」による手法に比べて、「脳融合型AI」の方が様々な知覚推定の問題で良い成績を残しています。

(参考論文)https://arxiv.org/abs/1905.10037

―「AIだけ」より成績が良いのは分かる気がしますが。「普通の脳解読」よりも良いのは、どうしてですか?

西田) 普通の脳解読では、脳活動の計測実験中にノイズが入るのも一因ですね。MRI装置の計測ノイズもそうですし、被験者さんは実験中にMRI装置内で映像を見るのですが、人って映像を見ていても他のことを考えたりしますから、それもノイズになりますね。脳融合型AIで用いる脳活動の予測のためのモデルは、たくさんの計測データから作成するので、こういった1回1回の計測で生じるノイズの影響を大幅に減らしてくれます。

―なるほど。では、「脳融合型AI」の応用としては、どんなことがあり得るのでしょうか。

西田) 例えば、ビジネス応用の一つとしては、株式会社NTTデータ様へライセンス提供のうえ現在実施している、脳融合型AIを用いた映像コンテンツの感性評価サービスです(NeuroAI®、http://nttdata-neuroai.com/)。脳融合型AIを用いることで、従来のAIでは難しかった感性の推定を可能にする、世界でも類を見ない画期的なサービスだといえます。また、同技術は工業製品デザインの評価や視聴覚ビッグデータの評価にも適用できますね。さらに、脳融合型AIは、個々人の脳情報をAIに融合できますので、個性を反映したAIを実現する可能性もあります。そのようなことが可能なら、商品等のレコメンデーションにおいては精度が大幅に良くなりますし、個性を理解する対話エージェントの実現にもつながります。あるいは、著名な芸術家の脳融合型AIを作成することで、個性のデジタルアーカイブとして彼ら彼女らの感性を後世に残せるかもしれません。さらには、脳融合型AIをロボットに搭載し、個性を有するロボットなども実現できるかもしれませんね。

一人ひとりの脳の可視化で、誰もが才能を伸ばして幸せになる未来社会を!

―AI、脳科学、ロボット。私の業務的にも、まとめて解決されて、ありがたいです(笑) 先生は、いつ頃から研究者を志されたのですか?京都ご出身、京都在住だとお聞きしましたが。

西田) 宇治に生まれ、京都市内に引っ越し、大学は京都工繊大、修士課程は奈良先端大、博士課程は京大です。「人間のようなAIを作りたい」と志し、大学では、深層学習が登場する前のAIの研究していました。そして、修士課程ではAI、特に機械学習を用いて人間の行動をモデリングする研究にも取り組んでいました。やがて、人間の認知機能のメカニズムを解明する方向への興味が強くなり、「脳を研究したい」という思いで、博士課程では、神経生理学の研究をしました。動物の脳からニューロン活動を電極で測定したりしていましたよ。その研究自体もとてもおもしろかったのですが、もっと人間そのものを研究対象にしたい、自分の研究成果を社会に還元したいと思い、国立研究開発法人情報通信研究機構(NICT)に入りました。そして、人を対象としたMRIの研究に取り組むかたわら、AIと脳科学を結び付ける研究もしています。

―今後の展望については、いかがでしょうか。

西田) 最終的には、私たちの脳の中で、世界がどのように表現されているのか、すべてを明らかにしたいです。そして、一人ひとりの脳の中にある、一人ひとりの世界の表現を可視化したいです。それが可能になれば、自分が見ている世界と、他の人が見ている世界は同じなのか、という私の子供の頃からの大きな疑問に、答えが出せると思っています。

―おもしろいですね!

西田) もう一つは教育です。可視化した脳内の情報から、その人の可能性、才能を見出して、一人ひとりみんなが幸せになる世の中にしたいですね。自分の才能を理解して伸ばしていける、新しい未来社会とでも言いましょうか。

 

すばらしい未来を、ぜひ創ってくださることを楽しみにしています!

お問い合わせ

商工労働観光部産業振興課

京都市上京区下立売通新町西入薮ノ内町

ファックス:075-414-4842

monozukuri@pref.kyoto.lg.jp