とあるメディアのタイアップ企画で書いた文章なんだけど、クライアントからNGとなり全面的にボツとなったので、供養替わりにここで公開。微妙にタイミングを外しているけど、賞味期限が切れるほどではないので。
-ーーーーーーーーーーーーーーーーーーーーーーーー
Watson日本語版の発表会において日本IBMの与那嶺社長が「Watsonの起源のひとつが日本語処理技術にある」と話したように、IBM Watsonの特徴は「ことば」の処理能力が高いことにある。一方、現在の人工知能ブームのきっかけとなったディープラーニングは、強力な画像認識が特徴だ。IBM Watsonにも画像認識の機能は備わっているが、なぜIBMはWatsonの強みとして「ことば」をアピールするのだろうか。
現在、さまざまな人工知能関連のサービスが登場している。そのひとつが、ディープラーニングと呼ばれる、多層構造のニューラルネットワークを利用した機械学習技術だ。ニューラルネットワークは以前からあった技術だが、近年になってブレイクスルーが起きて飛躍的に進化した。例えば、画像を認識に利用することで、そこに何が映っているのかをコンピュータが正確に判断できるまでになった。
犬にはさまざまな種類があり、体の大きさや色、または年齢によって、その外見が大きく異なる。また、写真によって明るさや向き、大きさなどはバラバラで従来の画像認識技術では、それをすべて「犬」と自動的に判断することは非常に難しかった。しかし、ディープラーニング技術によって、こうした画像認識技術が大幅に発展し、現在ではすでに人間を越えるほどの認識精度を実現している。
発表会においてデモンストレーションを行ったカラフル・ボードのコーディネート支援アプリ「SENSY」も、このディープラーニングを用いて、ファッションアイテムの認識を行っている。そのアイテムが、シャツなのかセーターかTシャツかスカートなのか、人間なら容易に見分けられるが、それと同様の「目」をディープラーニングが行っているのだ。SENSYはさらに、その人工知能にアイテム同士の組み合わせによるコーディネートを認識させようとしており、ディープラーニングはこれまで人にしかできなかった認識だけでなく、コーディネートのような感性といった曖昧さを含んだ分野をコンピュータ化できる可能性を秘めたものなのだ。
このディープラーニング技術において、早くも主導権争いが始まっている。Googleの「TensorFlow」、日本発の人工知能ベンチャーとして注目されているプリファードインフラストラクチャーの「Chainer」、マイクロソフトの「Computational Network Toolkit」などの解析エンジンがオープンソースソフトウェアとして公開されている。
これらのディープラーニングエンジンは、誰でも自由に使うことができ、エンジンを利用したアプリケーションやサービスをビジネス展開することも可能だ。それは、人工知能のプラットフォームとしての地位を確立することが、これからのIT業界において強い競争力を獲得することになると考えられるからだ。
これまでのインターネットにおいては、強力な検索サービスによってウェブへの入口という地位を獲得したGoogleが、その後広告事業で高い収益を上げ、ウェブにおける巨大な存在となった。AIにおいても、そのような地位を得ることをGoogleやMicrosoftは狙っていると言える。なぜなら、これからのITにおいて、AIは必須の技術となることがほぼ確実視されているからだ。その理由はIoTにある。
IoTはすでにバズワードとなりつつあるが、さまざまな機器がネットに繋がり、自らデータを生み出す世界はすでに始まっている。身近な所でも、すでに自動車は高度なセンサーの塊となっており、将来的に自動運転が実用化されたなら自動車間およびでのセンサーデータの共有は不可欠となる。そして、自動車などの機械が生み出すデータは、現在までに人間が生み出しているデータとは比べものにならないほど膨大な量となる。このIoTが生み出すビッグデータを処理するために、人工知能が必要なのだ。
IoTが生み出すデータ量は、あまりに膨大で、もはや人間が直接対処することは不可能だ。つまり、人工知能技術なくして、IoTは絵に描いた餅になってしまうのだ。そして、ビッグデータを処理するAIとしてのデファクトスタンダードの地位を得ることが、その後のAI時代における今のGoogleのような地位となりうるだろう。
その一方で、実はディープラーニング技術などの最先端のAIは、なぜ上手く動作するのか完全には解明されていない。同時に、ディープラーニングのシステムが学習した結果、つまり人間の「記憶」に相当するデータも、実は人にはほとんど理解できないデータの塊だ。そのため、人工知能が学習した成果を人間が把握するためには、人工知能によって人間の言葉として表現してもらう必要があるのだ。そこでIBM Watsonのように言語処理に優れた人工知能のもうひとつの活躍の場がある。
こうした人工知能は、IoT以外にも活用できる。たとえば、企業はいわゆる「データ」と呼ばれるもの、すなわち小売におけるPOSデータ、製造におけるプラントのデータ、顧客データなどだけでなく、日常業務のなかでさまざまなドキュメントも発生してる。日報や報告書、申請書やビジネスメールなどだ。こうしたテキストデータは、あまりデータとして活用されてこなかったが、人工知能技術によってそれらも「データ」として分析できるようになる。
それによって、これまで「人」が持っていたさまざまな業務上のノウハウが、明確なナレッジとして誰でも再利用可能なかたちで共有できるようになる。ソフトバンクが、デモ映像で見せた「ソフトバンクブレイン」が、そのひとつの形だ。Watsonが、社内文書から過去の事例を検索してくれるだけでなく、具体的に営業するための作戦まで考えてくれる。そうやって機械ができるところは機械に任せ、人間は人間にしかできない仕事に集中し、全体として生産性を上げる。これが当面のビジネスにおける人工知能活用のビジョンだ。
IBMはこれまで企業を相手にビジネスをしてきた。そして、企業が持ちながらデータとして十分に活用されていないものの多くは、テキストデータだ。つまり、企業向けのITシステムやサービスを手がけてきたIBMにとって、人工知能で処理する対象として「ことば」にフォーカスするのは自然流れといえる。
また、競争が起きているのは、AIのエンジン部分だけでない。それを高速に動作させるためのハードウェアもGPUベンダーのNVIDIAを筆頭に開発競争が起きているほか、アプリやサービスを動かすインフラとしてのクラウドにおいても、各事業者がAIエンジンを利用しやすいサービスやメニューの提供を始めている。このように、AI技術は、基礎的な部分はすでに実用的なサービスやプロダクトとして出そろいつつあり、AIのために必要なプラットフォームの各レイヤーにおける事業者間の競争も始まっている。
IBMはその競争に勝つため、「ことば」に強いWatsonを用いて企業が今取り組んでいるビジネスを支援するところから攻めようとしている。また、IBM WatsonのAPIを「Bluemix」というPaaSのなかに組み込んで提供しているのも、企業や開発者にとって利用しやすくするというメリットがある。そして、エンタープライズの領域からAIプラットフォーム競争に勝つことがIBMの本当の狙いなのだろう。