Pages

2015年4月1日水曜日

コンピュータによる自動化ってどこまで進むの? 〜「1テラを聞いて十を知る」〜

おはようございます。株式会社ユニリタの戌亥です。

本日から新年度が始まりますね。弊社も新しい会社、「株式会社ユニリタ」がスタートいたします。引き続きよろしくお願い致します。

最近、機械学習の話題が多くなってきましたね。3/5-7まで大津で行われましたBeaconユーザ会でも、AIや機械学習といった話題が多く見受けられました。

さて、先月のブログ『コンピュータによる自動化ってどこまで進むの 〜「演繹法」と「帰納法」 〜』で新井紀子さんの「コンピュータが仕事を奪う」という本を紹介いたしましたが、新井先生の「一テラを聞いて十を知る」という表現が気に入ったので、もう少し掘り下げたいと思います。
 
普通は「一を聞いて十を知る」ですよね。決してコンピュータがバカだと言っているわけではありません。コンピュータと人間の違いを、この言葉で表現しているだけです。

例えば、日本人である私たちは、富士山の写真を見せられると、どんな写真でも大体は富士山と認知することが出来ますよね。私は、脳科学者ではないので、それが脳の中でどのように解析されて認知されるかはよくわかりませんがなんらかの特徴を整理しているんだと推測しています。

写真だけではなく、絵を見ても富士山である事は理解できます。また、イラストの様な単純化した物についても富士山はわかります。これが「一を聞いて十を知る」ということなんでしょう。

しかし、コンピュータはどうでしょうか?写真を見て、富士山である事を認知したコンピュータが、富士山のイラストを見て、富士山である事を認知するのでしょうか?おそらく、写真、絵、イラストに関係なく富士山を認知させるためには、テラバイト級のデータが必要になるんだと思います。

人間は抽象化能力が優れています。AIって呼ばれていますが、コンピュータはまだまだ人間ほどの抽象化能力は無いのでしょう。コンピュータは最終的には1と0で計算するため、そこまで落とし込んでやらないと判断が出来ません。逆に人間にはできないことがあります。それは、テラバイト級のデータを覚えるという仕事です。また、そのテラバイト級のデータから、同じ様な特徴を持ったデータを仕分けすることもできます。人間がやるとなると、かなりのドメイン専門性が必要となります。例えば、膨大な判例の中から、裁判に必要な情報を抜き出すには、高給な弁護士先生にお願いしなければなりません。

日経ビジネスの2015年3月30日号でも、IBMのワトソンが2300万件の学術論文から7万件の文献を抽出し、がんに関わるタンパク質を操作する物質を見つけたと、書かれていました。スーパードクターでも、2300万件の論文に目を通すというのは至難の技だと思います。しかし、コンピュータならできるわけです。

コンピュータが本当に学習するのかという疑問がありますが、これも最近のキーワードとなっているディーブラーンニングという技術を使えばコンピュータ自体が学んでくれます。

GoogleのDQNという人工知能にゲームの「ブロック崩し」をやらせたところ、600回を超えた頃に、端のブロックを狙い始め、ブロックの裏側にボールを送り始めたそうです。コンピュータにルールを教え込むことなく、自分で学んでいるんですね。人間だと誰かブロック崩しの上手な人に、「端のブロックをねらって、ボールをブロックの裏側に送り込むと、たくさんポイントがとれるよ」なんて教えてもらって始めますよね。そうでないと面白くないので、すぐにやめてしまいます。コンピュータは大変辛抱強いですね。600回もかけて技を覚えるわけですから。

つまり、「一テラを聞いて十を知る」というのはコンピュータが得意な分野です。眠りませんし。文句もいいません。いや、文句を言うコンピュータが将来出てくるかもしれませんが。

つまり、たくさんのデータが手に入る分野は機械学習をつかいましょう。例えば、コンピュータプログラムでも、現在ではオープンソースという公開されたデータがあります。Javaのオープンソースのプログラムをできるだけたくさん読ませて、ソースコードのReviewerにしてはどうでしょうか?オープンソースのプロジェクトは大抵障害対応などのコードも公開されていますし、オープンソースのすべてのプロジェクトを集めると相当の数になるでしょう。

これを機械学習するコンピュータMr. Code Reviewerに読み込ませます。すると、Try CatchやThrowsなどの例外処理でよくおきるバグや条件分岐文でよくあるミスなどを学んでくれて、コードレビューした時に、このソースコードは障害が出やすいコーディングになっていますよ。なんて教えてくれるかもしれません。コンピュータソフトも機械学習で品質が向上する時がくるでしょう。

弊社のinfoScoopの技術者はJavascriptを使っていますが、デバッグ用のツールが少ないと言っているので、Javascript用のMr. Code Reviewerがいれば、大変役に立つかもしれません。


将来どうなるかはわかりませんが、今のところコンピュータと人間はお互い共存出来そうですね。

0 コメント:

コメントを投稿