AI新時代を生きる― 「技術の東芝」を追い求める研究者たち
2017/03/24 Toshiba Clip編集部
この記事の要点は...
- 東芝はAI研究開発の先端を走る
- 特徴量の設計が不要なディープラーニングがAI新時代への突破口に
- 東芝はインフラのビッグデータとドメイン知識を活用したAIサービスを追求
四日市工場、Visconti™、RECAIUS™―前3回で紹介してきたこれらには、東芝の高いAI技術が活かされている。
こうした技術や新しい価値を生み出すのが、東芝の研究開発センター。所長を務める堀修氏は、主に画像認識技術を研究し、東芝のAI技術開発とともに研究者人生を歩んできた。堀氏に東芝のAIのこれまでとこれからを聞いた。
AI研究の最前線に
―堀さんは1986年に東芝に入社されました。これは現在では第二次AIブームと呼んでいる時期に当たりますが、当時から堀さんは、ご自身の研究をAI研究として捉えていましたか。
東芝 研究開発センター 所長 堀修氏(以下 堀) はい。そのころからすでにAIという言葉はありましたし、マサチューセッツ工科大学(MIT)人工知能研究所のマービン・ミンスキー氏が非常に有名でした。そのような中で計算機にいかに知的な作業をさせるかがブームになっており、私自身も学生時代から、人間ができることを機械にやらせることに興味がありました。
当時から東芝はAIを使った画像認識の技術でトップレベルにいて、そこに魅力を感じて東芝に入社しました。私が入社して本格的に取り組んだ研究は、地下埋設送電線図の手描きの紙図面を画像認識でCADデータに置き換えるシステムの開発です。人が描いた図面の画像から、これは直線だ、これは文字だ、と機械に認識させるのです。
もともと東芝では発電所のプラント系統図をCADデータに変換するシステムが作られていて、顧客であった電力会社からの依頼を受け、今度はそれを地下埋設送電線図で行おうとしたのです。
AIの進化と研究開発の変遷
人間が機械に知識を詰め込まなくてはならないという壁
―すでに発電所のプラント系統図のCADデータ変換システムは作られていたのですよね。地下埋設送電線地図には別の技術が必要だったのですか。
堀 そうなんです。第二次AIブーム期のAI研究は機械に知識を詰め込むのが主流でした。
例えば、機械にニワトリを認識させるには、「『ニワトリ』とは、トサカを持ち、コケコッコーと鳴く飛べない鳥」などといったルールを人間が記述して機械に覚えさせるわけです。そのためニワトリならニワトリ、ネコならネコと、認識させる対象ごとに、別々のルールを記述する必要がありました。
プラント系統図と送電線図では、識別すべきマークも読み取るときの信号処理も異なります。応用できるところもあるのですが、やはり新たにシステムを作り直さねばなりませんでした。
機械学習研究で突破口を探る
―機械に対象物を認識させるために人間がルールを事前に記述しなくてはならないこと、それが第二次AIブームの限界だったわけですね。
それからいわゆるAIの長い冬の時代が始まります。その時代にも東芝ではAI研究を続けていたのですか。
堀 当時、私の周りでは、AIという言葉は使わなくなりましたが、同じような研究はしていました。AI研究は脈々と続いているといえるでしょう。ただその興味の対象が移っただけなのです。
画像処理だと、例えば80年代にロボットの目を必死に研究していた人は車載向け画像認識の方に移っていった。これまで二足歩行をやっていたのが、四輪になってしまったけど、まあ、いいかって。
でもそれが実は今の東芝の自動運転支援技術につながっているのです。
―では堀さんも図面の画像認識から別の研究に移行されたのですか。
堀 私は映像の世界に入っていきました。
1995年ごろ、ワールド・ワイド・ウェブが普及してきて、今後、テキストや画像、映像など、マルチメディアデータは増加していくであろうと予想されていました。
そのような中で膨大なデータから所望の情報をテキストで検索するシステムではそれなりに成果が出ていました。
それならば私は、人間が見ると分かるのだけれども機械では難しい映像の検索をやってみようと研究しはじめ、特にニーズの高い、人の顔が写っている場所の検索に着手しました。
当時、特徴量の設計ということが大きな研究課題でした。機械に人の顔を認識させるには、まず人の目や耳に着目し、それらの特徴を示す指標として特徴量を設計しなければいけません。
人間だといちいちそのような事前の設計がなくても、経験的に人の目がどのようなものなのかということが分かっていて、人の目を見たときに、きちんと目だと認識できますが、機械相手だと、きちんと設計しないと人の目だと認識してくれません。
AI冬の時代といわれたこの時期にも、さまざまな特徴量設計の方法が提案されていたのですよ。
私たちが提案したのは「共起特徴」です。顔には目や耳があり、それらは同時に発見されますよね。「共起特徴」とは、そういった同時にあるものの組み合わせで特徴量の種類を増やし、顔の特徴を再設計することで、機械が対象物を高精度に認識できるようにするものです。
車載向け画像認識プロセッサVisconti™の歩行者認識で用いられるCoHOG(※)も共起特徴の一種です。
(※)CoHOG:輝度情報を用いた当社独自の高性能画像特徴量アルゴリズム
―冬の時代でも画像認識技術で成果があったとは意外です。
堀 冬の時代とはいえ、対象データから特徴量を算出しを統計的に処理して、対象の識別方法を学習する統計的機械学習の分野では、特徴量の種類を増やす「共起特徴」の提案など、できることがたくさんありました。
当時、AIの研究開発では2つの方向性があって、その1つは人の脳の神経を模してAIを作るニューラルネット研究。
しかし当時の計算機の処理能力に限界があり、なかなか実用化が難しかった。
だから私は、もう1つの方向性である統計的機械学習を研究し、より多くの製品の実用化の道筋を探り続けていたのです。
特徴量を自分で学習するディープラーニング
―統計的機械学習の研究を行っていた堀さんが、ディープラーニングに注目し始めたのはいつ頃ですか。ディープラーニングは自分で学習するAIといわれていますよね。
堀 私が存在を知ったのは2013年です。
世界的な画像認識のコンペティションでトロント大学が開発した“Super Vision”が圧勝したのが2012年。それにディープラーニングが使われていたのです。
話を聞いてみて、これは今までのものとは違うなとすぐに思いました。従来の機械では全くできないことをしていたからです。
実は今までの統計的機械学習でも、人間が設計した特徴量をもとに、識別の部分は機械が自分で学習していました。
自分で学習するという意味では、統計的機械学習もディープラーニングと同じです。
しかし、統計的機械学習において、特徴量は自分で設計してくれない。例えば、耳が長いものをウサギにしましょうと教えると、機械は対象をウサギだと識別してくれますが、耳が長いという点に着目した特徴量は自分で設計してくれません。
だから私たちは共起特徴などを必死でやって、特徴量の設計を行っていたわけです。
でもディープラーニングでは特徴量の設計自体を機械がやってしまうのです。大量の画像を機械に入力して、それがウサギだと私たちが教えれば、どの特徴量に注目してウサギだと識別するのかも機械が勝手にやる。
この特徴量を設計するというひと手間を省けたことがとても大きかったのです。
インフラ×AIで社会を支える
―ディープラーニング登場後の東芝AIの強みを教えてください。
堀 ディープラーニングにおける東芝の強みは2つあると考えています。
まずは資質の高い研究者の存在です。今はAIと呼んでいるのだけれども、昔は機械学習と言ったり、パターン認識と言ったり、AI研究の伝統が東芝にはあります。
実は2012年にディープラーニングが登場したとき、日本ではニューラルネットの冬の時代で懲りていたこともあって、冷たい反応をする人も少なくなかった。
しかし東芝の研究者には、好意的だろうが、そうでなかろうが、ディープラーニングに注目している人が多かった。最先端の技術に反応できるだけの土壌が東芝には育っていたのです。
もう一つの強みは東芝がインフラのビッグデータとドメイン知識(知見)を持っているということです。
ディープラーニングで機械に特徴量を学ばせようとすると多くのデータが必要です。東芝は、フラッシュメモリの量産を担う四日市工場の製造データをはじめとして、巨大なインフラのビッグデータを抱えていて、しかもドメイン知識を持つ工場などの現場の人がいる。
この2つの強みがあって、社内の中だけでAIの研究開発ができてしまうのです。それで四日市工場のプロジェクトも立ち上げてから短期間で成果が出たのだと思います。
『東芝ならでは』の人工知能
―東芝は、長年培ってきた社会インフラ領域の技術とAIを組み合わせて、どのような課題を解決していこうとしているのでしょうか。
堀 IoTという言葉がありますよね。これはよくウェブ上のデータとモノとを結びつけるというイメージが持たれています。
しかしこれからのIoTはモノからもデータを取り出していくと思っています。
東芝だと、道路や鉄道、町、工場といった社会インフラシステムにセンサーを付けて、そこからデータを吸い上げる。でもそのような大規模なデータはとても人間の手では分析できません。それをAIに分析させる。そうすることで事故が起こる前に予測して、それを未然に防ぎ、最適にコントロールすることができます。
高い信頼性が求められるインフラシステムを作り出し、社会のあらゆる複雑なシステムを最適な方向にコントロールしていくことが、東芝が社会課題で貢献できる分野です。
―具体的に私たちの生活はどのように変化すると思われますか。
堀 例えば電気ですね。今、日本では電力が自由化され、これまでひとつの電力会社でコントロールしていたものに、さまざまな会社が参入して売買するようになっています。
このような中で、もし需要と供給のバランスを適正にとることができなくなれば、停電してしまう可能性もあります。
そうしたことが起きないように、個人情報に配慮した上で、売買のデータを集約して、どこで発電をして、どこで発電をやめるのか、ということをリアルタイムでAIに判断させる。こうしたことが安全でかつ効率的な発電につながっていくでしょう。
AIは人を幸せにするツール
―AI研究では、倫理面や社会制度面などさまざまな側面から議論がなされていますが、これからのAIについて堀さんはどのようにお考えですか。
堀 私は、「人間が見て知的に思えるような所作や行動をする機械」というのがAIの広義の定義だと考えています。だから一見知的に見えるような職業がAIに奪われるといわれているのだと思いますね。
仕事には責任がつきものですから、AIが仕事で失敗した場合、だれが責任を取るのかということも議論されています。AIの発展には問題が山積しているといえるでしょう。
また、機械は過去のデータしか扱うことができません。
新しい状況や、人間の新たな発想などを含めた総合判断は、やはりAIには難しいところなのです。
ですからこれからも人間には、そのような意味での創造的な判断が求められていると考えています。東芝は技術の会社だといわれています。
私もやはり東芝は技術を大切にする会社だと思います。技術というものは人を幸せにするために開発しているのであって、AIというものは、人を幸せにするひとつの有力なツールです。そうした強力なツールを東芝がこれからも作っていくということはとても夢のあることだと思っています。