ディープラーニングが破壊的な理由 ニューラルネットの衝撃

人工知能の始まりは1956年のダートマス会議とされています。AIの先駆者たちの夢は「コンピューターによって実現できる、人間の知能と同じ特徴を持つ複雑なマシンを構築すること」でした。これは「汎用AI」(General AI)――つまり、人間のあらゆる感覚と、あらゆる判断力を備え、人間と同じように考える、驚異のマシンを生み出すことでした。

実際には物事は簡単に進みませんでした。人工知能はこれまでも2度のブームと2度の冬の時代を経験し、今回が3度目のブームなのです。

日本でも人工知能開発が熱を帯びた時期がありました。第2次AIブーム時(1970〜80年代)に日本は通産省(当時)中心で新世代コンピュータ開発機構(ICOT)を設立し、高度な推論を行う人工知能である「第5世代コンピューター」を構築しようとしました。ICOTは人間と同じ高度な推論をやろうとしましたが、人間は無意識でしていることを言葉で説明できない。高度な診療などを目指していましたが、医者が抽象的、論理的にやっていると考えられたことでさえも、言葉で明確に説明できないことがわかりました。人間の行動のかなりの部分が無意識に感覚的に行っていることに依存していることがわかったのです。言語化できないことはプログラムでは書けませんでした。

今回はインターネットが発達しデータが増えてきたことに加え、コンピューティングパワーが向上しています。これまでのAI / 機械学習は特徴量を人間が定め、現実世界から重要な部分を抜き出す(モデリング)ことを人間が担ってきましたが、ディープラーニング(深層学習)が大きなブレイクスルーでした。マシーンが自ずからモデルを設計し、自律的に特徴量を設定できるようになったことが大きいのです。

「人間の脳はある種の電気回路。人間の脳が行うが情報処理であれば、コンピュータでできないわけがない」とアラン・チューリングは考えましたが、実際には60年間実現できませんでした。

これまでに人類が実現したことは「特化型AI」(Narrow AI)の概念に当てはまります。これは、特定のタスクについて、人間と同等(あるいはそれ以上)の処理をこなすことができるテクノロジです。特化型AIの例としては、YouTubeでの猫画像分類や、Facebookでの顔認識といったものが挙げられます。

ディープラーニング

初期の機械学習研究者によって生み出された別のアルゴリズム・アプローチに「人工ニューラル・ネットワーク」がありますが、数十年の間に現れてはその大半が消えていきました。ニューラル・ネットワークは、人間の脳の生物学的しくみ(ニューロン間のあらゆる相互接続)の理解から着想を得たものです。ただし、すべてのニューロンが特定の物理的範囲内にある他のどのニューロンにも接続できる生物学的な脳とは異なり、人工ニューラル・ネットワークでは、データの伝達において、層、接続、方向が個別に定義されます。

ディープラーニングは1979年に福島邦彦氏が発案した「ネオコグニトロン」に起源があります。ネオコグニトロンは目の視神経の繋がり方にヒントを得ていますが、当時はコンピュータの処理能力が足らなかったりアルゴリズムの工夫がうまくいかなかったりと効果を発揮できなかった。

たとえば、画像を抽出し、それを多数のタイルに分けて、ニューラル・ネットワークの最初の層に入力するとします。最初の層の個々のニューロンによって2つ目の層にデータが渡されます。2つ目のニューロン層で所定のタスクが実行され、以降、最後の層にデータが渡され、最終的な出力が生成されるまで同様の処理が繰り返されます。

各ニューロンは、それぞれの入力に対して重み(実行されるタスクに対する正誤の確率)を割り当てます。そして、最終的な出力がそれらの重みの合計によって決まります。ニューラル・ネットワークのタスクは、それが「一時停止標識」かどうかを割り出し、重みに基づいて「確率ベクトル」(非常に高度な知見によって裏付けられた推測)を提示します。

AIの草創期から存在したニューラル・ネットワークですが、これまでほとんど「知能」を生み出しませんでした。問題は、もっとも基本的なニューラル・ネットワークでさえ計算処理上の要求が非常に高く、単純に実用的なアプローチではなかったということにあります。それでもなお、トロント大学のGeoffrey Hinton率いる異端研究の少人数グループはあきらめずに研究を続け、ついにスーパーコンピューターでの実行に対応したアルゴリズムの並列化に成功し、その概念を実証しました。

ニューラル・ネットワークは一時停止標識の見た目を独習できるようになりました。これは、Facebookの場合なら母親の顔、あるいは、2012年にAndrew NgがGoogleで成功させた猫にも当てはまります。Ngの画期的なアプローチとは、そうしたニューラル・ネットワークを利用して、本質的にそれらを大幅に拡大し、層とニューロンを増やして、膨大なデータをシステムで処理することで、システムのトレーニングを行うというものです。Ngの場合、それは1000万本のYouTubeビデオの画像でした。Ngはディープラーニングにニューラル・ネットワークのすべての層を表す「ディープ」(深層)を取り入れたのです。

現在、いくつかのシナリオでは、ディープラーニングを利用してトレーニングが行われたマシンによる画像認識が人間の能力を超えるまでになっています。その範囲は、猫から、MRIスキャンでの腫瘍や血液におけるがんの手掛かりの特定まで、多岐にわたります。また、Googleのアルファ碁は、囲碁を学習し、アルファ碁自身との対局を何度も繰り返してトレーニングを行い、そのニューラル・ネットワークを最適化しました。

そして、先週、Alpha Go Zeroは世界に衝撃を与えました。Alpha Go Zeroは人間のトレーニングデータを利用しないで、李セドルに勝利したバージョンを超すのに、学習に要したのは3日です。それよりも格段に強いバージョンであるマスターに勝利するのにも21日のみです。

Elo%20Ratings.width-1500.png

Via DeepMind

ディープラーニングが拡大する可能性

ディープラーニングによって、機械学習、ひいてはAI分野全体の実用的応用が数多く実現しました。ディープラーニングでは、マシンによるあらゆる種類の支援が可能になる(あるいは、期待できる)方法でタスクを分類できます。無人自動車、より予防効果の高い医療、あるいは、より的確な映画の提案は、どれもすでに実用化されているか、今後の実用化が見込まれるものです。AIは、現在および未来のテクノロジです。ディープラーニングの助けを借りることで、AIは人類が長らく思い描いてきたサイエンス・フィクションの状態に、より近づくことができるでしょう。

Written by 吉田拓史

Via Google Research Blog

コメントを残す