ヒトの脳を模し、人工知能の学習能力を形成する基盤となるニューラルネットワーク。その欠点を補い、自己学習能力をさらに高める「カプセルネットワーク」をグーグルの研究員が発表した。コンピューターの画像認識能力であるコンピューターヴィジョンを進化させ、自律走行車への活用も期待される新たな概念とは。

人工知能(AI)を巡る世間の浮かれぶりについて誰かに文句をつけたくなったら、69歳のグーグルの研究員、ジェフ・ヒントンがおあつらえ向きだ。カナダのトロント大学に籍を置くこのひょうきんな教授は、2012年10月にAI研究の世界に衝撃を与え、新たな軌道に乗せた。

ヒントンが2人の大学院生と発表した内容によると、何十年も研究対象として挑み続けてきた時代遅れの技術「人工ニューラルネットワーク」が、機械の画像認識機能を飛躍的に向上させたという。ニューラルネットワークとは、人間の脳をモデルに神経細胞(ニューロン)とそのつながりを人工的に構築したものだ。AIに応用され、与えたデータを基に新しい概念を学習させる際などに活用されている。

その発表から6カ月もたたないうちに、3人の研究者はグーグルの従業員名簿に名を連ねた。いまや、ニューラルネットワークはわたしたちのスピーチを文字に起こし、芝生の上を歩く猫を(犬でもブタでもなく)猫だと認識し、インターネット上の荒らしと闘っている。

しかしヒントンは現在、自身がこの世に生み出すのを助けた技術を大したものではないと考えている。「われわれは(コンピューターに画像認識という“視覚”能力を与える)コンピューターヴィジョン技術における活用法を間違えていると思います。現時点においては何よりもうまく機能していますが、だからといって正しいわけではないのです」と言う。

コンピューターヴィジョンを進化させる新たな概念

代わりにヒントンは、別の“古い”アイデアについて明かした。コンピューターが物事を認識する方法を変える、つまり新たな形態のAIをつくり出すものだ。これは非常に重要な概念である。というのも、コンピューターヴィジョンは自律走行車や医師の役割を果たすソフトウェアに欠かせないからだ。

2017年10月下旬、ヒントンは2つの論文を発表し、40年近く熟考を重ねた考えについて証明した。「これはとても長い期間にわたってわたしにもたらされた、多くの直観によって出来上がったものです。ずっとうまくまとまりませんでしたが、ついに発表することができました」と話す。

ヒントンの新たな研究は「カプセルネットワーク」と呼ばれる。ニューラルネットワークを発展させたもので、画像や動画を通じて機械に世界を理解させやすくすることを目指している。

発表した論文のうちの1つでは、カプセルネットワークの正確さについて、ニューラルネットワークの最高時のパフォーマンスに匹敵したと述べた。ソフトウェアが手書きの数字をどれだけ正確に認識できるかという基準テストを行って得られた結果だという。

2つ目の論文ではカプセルネットワークの誤答率について、ニューラルネットワークのそれが最も低かったときのほぼ半分にまで減少したと発表した。トラックやクルマといったおもちゃを、異なる角度からソフトウェアに認識させる課題を通じて結果を得た。

仮想ニューロンを詰めた“カプセル”で自己学習を促進

ヒントンは現在もこの新しい技術の研究を続けている。同僚は2人、サラ・サブールとニコラス・フロストで、拠点はグーグルのカナダ・トロント支社だ。

カプセルネットワークの目的は、いまある機械学習システムの弱点を克服することにある。すなわち、本来なら発揮できるはずの効果を制限してしまう点を改善しようというものだ。

今日、グーグルや他社で使われている画像認識ソフトウェアでは、あらゆる場面で対象物を確実に認識しようとすると、多くの写真を参考にしなければならない。というのも、こうしたソフトウェアは、学んだことをこれまでにない文脈で一般化するのが得意ではないからだ。例えば、あるモノを別の新しい視点から見て同じものだと判断する作業は、あまり上手ではない。

コンピューターに猫をさまざまな角度から認識させるには、多様な視点で撮影した写真が何千枚も必要だ。人間の子どもであれば、そのようなくどく果てしない訓練を必要としなくても、家で飼っているペットを認識できるようになる。
以下ソース
https://wired.jp/2017/11/28/google-capsule-networks/