老舗のAI技術を人々の身近な生活の中に ~東芝コミュニケーションAI「RECAIUS™」~
2017/03/22 Toshiba Clip編集部
この記事の要点は...
- 東芝コミュニケーションAI「RECAIUS™」
- 音声を翻訳、画像も翻訳
- IoTの先を見据えた技術開発
AIが人と人のコミュニケーションをサポート
音声や画像を認識する技術が向上し、その技術を使って集められた情報・データが大量に蓄積できるようになった現在、コンピュータが情報・データを解釈し、判断するAIの技術開発も日々進んでいる。
東芝は、長年培ってきた音声認識技術や画像認識技術と、認識した音声や画像を自ら考え処理する知識処理技術を連携させ、人と人のコミュニケーションをサポートする東芝コミュニケーションAI「RECAIUS™(リカイアス)」を提供している。
例えば、人が話した音声を文字にし、自動で報告書を作成する技術や、カメラ映像から人の属性や行動を捉えて、状況の理解や予測を行う技術である。
東芝インダストリアルICTソリューション社でRECAIUS™の事業開発を推進する梅木秀雄氏は、「人とAIがより安心で快適に共存する社会の実現には、人の感覚や体験知を考慮した制御や判断が重要です。人は音声が十分に聞き取れなくても、文脈を考えて適切な応答が可能です。また、一問一答だけではなく、複数の話題が混ざる会話もシナリオを作成し予測して対話応答ができます。さらに、対話を通じて知識を蓄えたり修正できたりします。東芝のコミュニケーションAI「RECAIUS™」は、人の表情や音声や動きから、人と同じ感覚でどういう意図や状況なのかを複合的に把握して、適切な対応や処理につなげるサービスです」と語る。
異文化コミュニケーションも母国語で
ある言語で話された音声を別の言語に通訳する技術もRECAIUS™が提供するサービスの一つ。
スマートフォンを利用した通訳アプリは世の中にも溢れているが、「RECAIUS™音声トランスレータ/同時通訳サービス」の特徴は、状況に応じて固有の単語や例文をユーザー自身が事前に登録できることと、一文一文に区切らず続けて話してもRECAIUS™が翻訳に適した単位を自動で判断して逐次翻訳してくれること。
直訳すると意味が通じなくなってしまう固有名詞を無理に訳そうとして意味の通らない訳になってしまうことがよくあるが、事前に登録をしてこう訳すべき(または固有名詞なので無理に訳す必要はない)と指示を与えておけば、RECAIUS™は適切に翻訳することができる。
また一文一文ぶつ切りにすることなく話ができ、同時通訳のように訳されれば、話す方にも聞く方にもストレスが少ない。
「聞いて訳す」から「見て訳す」へ
音声を訳すのではなく、目に見える文字情報をある言語から異なる言語に即時に訳す技術開発も進んでいる。
海外の旅行先でおいしいと評判のレストランを訪れる。どんな料理を注文しようかとメニューを見ても言葉がわからず、料理の写真も付いていないので、どんな料理なのかわからない。
こんな時、スマートフォンのカメラでメニューを撮影し、それが母国語で表示されればどうだろか。
東芝が開発するカメラ画像認識技術は、カメラ画像から文字列を検出し認識するための技術。
カメラで撮影する画像は、文字情報だけでなく背景や文字以外の物が写ってしまい、撮り方によっては文字が変形してしまうこともある。
東芝は顔認識や人物検出などの画像認識の研究で培った独自の画像特徴抽出技術を開発して、文字以外の情報を含むカメラ画像からも文字を検出することを可能にした。
この技術を使えばスマートフォンやタブレットのカメラで撮影した風景の画像の中からでも文字列を認識しどの言語であるかを判断して、その文字列を別の言語に訳して表示することも可能になる。眼鏡のようなウェアラブルデバイスと組み合わせると、目の前にある外国語の世界を母国語で見ることもできるようになるかもしれない。
“人を想う”技術開発
生活の中にあるモノがインターネットでつながっていくIoT(Internet of Things)時代。梅木氏は「IoTの先にあるのは、モノとモノだけでなく、モノとICTと人がつながることで、人々の生活やビジネス活動をより安心で安全、そして快適に支える”人を想うIoT”であると考えています」と語る。使っているうちに賢くなるAI技術の開発をさらに進め、その先にあるより安心・安全・快適な社会の実現を目指していく。