人とモノをつなげる RECAIUSが創る未来

2015/12/02 Toshiba Clip編集部

人とモノをつなげる RECAIUSが創る未来

身の回りのすべてのモノがインターネットでつながっていくIoT(Internet of Things)時代。これまでインターネットとは無縁だったモノがつながることで、新しい価値が生まれるようになった。最近では、テレビやエアコンをスマートフォンで遠隔操作することにより、職場からでも番組を録画することができたり、帰宅時間に合わせ室温を調整しておくことが可能になるなど、その利便性を体感できる機会も増えている。今後は身近な家電機器だけでなく、医療や交通、農業など、さまざまな分野でIoT化が進んでいくとみられるが、IoTの最先端ではどのようなサービスが生まれているのだろうか。今回はIoTを活用し、人々の活動をサポートするクラウドサービス「RECAIUS(リカイアス)」を通じて、新時代のテクノロジーの可能性を探った。

「見る・聴く・話す」の理解をサポート

「IoTの先にあるのは、モノとモノだけでなく、モノとICTと人がつながることで、人々の生活やビジネス活動をより安心で安全、そして快適に支える“人を想うIoT”であると考えています」

梅木秀雄氏
梅木秀雄氏

そう語るのは、東芝のインダストリアルICTソリューション社の梅木秀雄氏だ。梅木氏は音声認識・合成、翻訳、対話などの研究開発部門を率い、現在はメディアインテリジェンスの事業開発を推進している。新サービスRECAIUSも、メディアインテリジェンスの技術を使ったものだが、そもそもメディアインテリジェンスとはどのようなものなのか。

 

「メディアインテリジェンスとは、人の意図や状況を理解する技術です。東芝が開発した手書きの郵便番号を自動で読み取る、郵便区分機などもこの技術が使われています。メディアインテリジェンスには大きく分けると『音声』『映像』『言葉と知識』の3分野があり、これらを連携、融合させ、音声や映像から人の意図や状況を理解し、人にわかりやすく伝えるのがRECAIUSというサービスです。実はRECAIUSというネーミングも、私たち(アス)を理解する(リカイ)ということから、名づけられています。人が持つ“見る・聴く・話す”といった能力をRECAIUSが補完し、さまざまなシーンでの人と人とのコミュニュケーションをサポートすることを目指しています」

音声認識とテキスト分析が融合した「音声ビューア」のインパクト

RECAIUSには、同時通訳や音声書き起こし、人物の認識など、さまざまな標準サービスが備わっているが、今回は先進の音声認識とテキスト分析技術を融合した「音声ビューア」をピックアップする。

 

「音声ビューア」は会議やグループ間の会話、個人の音声メモなど、記録した音声を認識しテキスト化できるサービスである。その最大の特長はキーワードを自動抽出し、重要な発言や開始何分くらいにどんな会話がなされていたかを視覚的に把握できることだ。例えば、会議やインタビュー取材など、音声の記録が長時間に及ぶ場合、改めて聞き直すのには多大な労力が掛かる。そのため、重要な発言やアイデアはその場にいる人間が、その都度メモをとっておくことになるが、「音声ビューア」はそれを自動で行ってくれる。会議に参加した人間が後から容易に会話内容を振り返れるだけでなく、その場にいなかった者に対しても簡単に内容を共有できる。

「RECAIUS 音声ビューア」の仕組み
「RECAIUS 音声ビューア」の仕組み

「人が何を話していたかを解析することは、元々コールセンターの会話の分析で用いられていた技術で、実は随分前からやっていたことでした。それをカジュアルに一般のビジネスのコミュニケーションに使えるようにしたのが、この音声ビューアです。音声をテキスト化するというと、多くの人はその正確性を求めていくと思います。例えば、いかに正確な議事録がつくれるか、ということに意識が向くわけです。現在の音声認識の技術は非常に高くなっているのですが、完璧な議事録をつくろうとするとやはりまだ精度が足らない。細かいところが気になってくるわけです。しかし、音声ビューアはそういったアプローチではなく、長時間に及ぶ会話の中で、後で聞いたときにどこが重要だったか、あるいは印象には残らなかったが実はよいアイデアだったということなど、どこにどんな発言があったかを把握することにフォーカスしています。音声がたまったときに、それをどのよう扱うか。そのひとつの切り口を、アプリケーションを通じて体験していただけたらと思います」

キーワード自動抽出(サマリービュー)画面
キーワード自動抽出(サマリービュー)画面

テキスト化の精度を追求するのではなく、実際のコミュニュケーションに役立つ機能の追求をしている「音声ビューア」は、まさに“人を想うIoT”であり、対象があくまで人への理解だということを物語っている。すぐにでもさまざまなシーンで活躍しそうな「音声ビューア」であるが、会話の重要度はどのような仕組みで判別しているのだろうか。

 

「キーワード抽出の技術は、元々は文章分類などで用いていた技術で、単語自体の頻度やかたよった単語、文章を特徴づけるワードを抽出しているので、実際に重要かどうかを判別しているわけではありません。例えば、私たちは重要なことを話すときに、“弊社が一番大事にしていることは”や“一番駄目なのは”だとか、あるいは“売り上げが○○億円”など、特定の前置きや数字を絡めることが多くなります。そういった表現が出て来たら、ピックアップをするというようにしておくことで、重要なトピックスを捉えることができるわけです。ですから、会話内容が本当に重要かどうかを最後に判断するのは人になります。RECAIUSはあくまで、人のコミュニケーションのサポート役ですね」

梅木秀雄氏

 

人に代わっていく技術へ

「音声ビューア」は会議などの内容把握や情報共有だけでなく、フィールド業務でも威力を発揮する。点検作業などのフィールド業務では両手がふさがる時間帯も多い。その都度メモをとったり、スマートフォンなどのデバイスを取り出さなくても、呟くだけでテキストメモが作成でき、情報伝達や共有ができれば、作業効率も格段に上がる。医療や介護の現場からの期待も大きい。

 

「RECAIUSには音声ビューアだけでなく、翻訳や音声合成、画像認識による人物の解析を行うサービスもありますから、リファレンスアプリケーションとして、多くの人に使って頂きたいと思っています。また今後は、我々自身がサービスの主体となるような事業を立ち上げていく方針です。例えば、早めに広げたいと思っているのが、コールセンターでの自動応答です。商品のどこが壊れてしまったか、何が困っているのかなどを、人間に代わってお客さまから聞き取り、自動で受け答えできるようなサービスにできればと考えています。そのようなことをいろいろな分野で、相手の求めていることを理解し、人間の代わりに受け答えができるサービスをつくっていきたいですね」

 

今後はさまざまなシーンで、自動化や無人化が加速していくだろう。そうなったときこそ、人に寄り添った技術やサービスが求められていく。東芝の“人を想うIoT”の技術は、安心・安全・快適な社会の実現に向け、確実に大きな一歩を踏み出している。

東芝ICTソリューションフェア2015  RECAIUSブース

東芝ICTソリューションフェア2015  RECAIUSブース (11月5/6日 お台場)

Related Contents