TOP > デジタルソリューション研究開発 > ほしい音声を思いのままに 「声デザイン」技術

ほしい音声を思いのままに 「声デザイン」技術


ほしい音声を思いのままに 「声デザイン」技術

この記事の要点は…
必要な声色を簡単に合成できる最新技術

GUIで直感的な操作が可能

2016年度中の実用化を目指す

カーナビやスマートフォン、エレベーターなど、機械による自動音声案内は私たちの日常に溶け込んだ光景となっている。それを支えるのは「音声合成」と呼ばれる、任意のテキストを自然に読み上げる技術だ

音声合成の技術の進化はめざましく、より自然で人の声に近い音声を合成できるようになっている。さらに、話者の声から特徴をつかみ、その話者によく似た声を合成できる「似声」作成技術や、喜び・怒り・哀しみなどを表現できる感情制御機能の実用化も進んでいる。

東芝では、カーナビなどに組み込まれた音声合成ソフトの分野で長年トップシェアを維持している。その技術力を活かし、多様な音声を低コスト・短期間で簡単に作成できる「声デザイン」技術を開発。パソコンなどで直感的に操作することができ、これまでは数日かかっていた作業が数分でできるようになった。

直感的な操作を可能にした2つの工夫

声デザインの最大の魅力は、ほしい声を、誰でも簡単につくりだせることです。音声合成は、教材や書籍の音声化、機器の操作ガイドなど様々な形で利用されていますが、これまでは限られた声の選択肢しかありませんでした。『本当はもう少し明るい声がよいのだけど…』といった要望に応えきれない場面もあったのです」

声デザインの生みの親である鈴木優氏。東芝 インダストリICTソリューション社で商品企画を担当している。

声デザインの生みの親である鈴木優氏。東芝 インダストリICTソリューション社で商品企画を担当している。

本システムでは性別、年齢、明るさなどの声の特徴を示す7つの項目の数値をグラフ上で操作することで、数万種類以上の音声を簡単につくりだせる。画面には、グラフィカル・ユーザー・インターフェース(GUI)を取り入れており、直感的な操作を実現した。

多様な声を自在に作成できる、東芝の声デザイン技術。
この動画は2016年3月7日に公開されたものです。

例えば、若い女性の声をつくりたい時には、まず、キャラクターのアイコンからイメージに近いものを選ぶ。ベースになる音声を選び、それからグラフ上での操作にうつる。
「音声のイメージは合っているが、もう少し変えたい」という場合は、先述のグラフでカーソル位置を操作することで、即座に調整できる。これまでは、声優による再録が必要なケースもあり、多くの時間やコストがかかっていたが、本システムを使えば、低コストで簡単にイメージ通りの音声をつくることが可能になる

直感的な操作を実現した背景にはどのような工夫があったのだろうか。開発チームを率いる森田眞弘氏は、声の特徴をスコア化したことがポイントになったと語る。

「直感的な操作を可能にするためには、その人が抱いている印象の通りに音声を変化させることが重要になってきます。そのためには声の特徴を示す形容詞とその度合を共有する必要がありました。
私たちはまず、声の特徴を表わす言葉を選定するために、統計処理によって代表的な形容詞を抽出しました。次に、選択した言葉を評価軸にした主観評価を行い、その結果からそれぞれの声の特徴を表すスコアを算出しました。さらに、スコア化された声のデータを分析することで、スコアと声の特徴の関係を統計的にモデル化しました。こうして作りあげた統計モデルを基に、あるスコアを与えると、イメージ通りの特徴を持つ音声が合成できるようになりました。」

声デザイン開発チームを率いる森田眞弘氏

入社以来、音声合成一筋という森田氏。学生時代は音声によって金魚の脳神経のつながりが強まり逃避行動パターンが変化することを明らかにするユニークな研究をしていた。

> 次ページ声デザインが生み出す新たなクリエイティブの可能性

Related Articles Related Articles
  • 防犯カメラにAIを活用 迷子の捜索も簡単に?!

    防犯カメラにAIを活用 迷子の捜索も簡単に?!

  • お笑いジャーナリスト・たかまつななさんと学ぶ「SDGs×東芝」

    お笑いジャーナリスト・たかまつななさんと学ぶ「SDGs×東芝」

  • 情報管理の新常識 レシートから未来の革新へ

    情報管理の新常識 レシートから未来の革新へ

  • マンホールアプリ「Manhoo!」が 生み出す新たな情報の姿とは?

    マンホールアプリ「Manhoo!」が 生み出す新たな情報の姿とは?

  • 原子炉格納容器の内部を探る 水中遊泳ロボットの奮闘!

    原子炉格納容器の内部を探る 水中遊泳ロボットの奮闘!

  • 21世紀のネオ産業革命 Connected Industriesの5本の矢

    21世紀のネオ産業革命 Connected Industriesの5本の矢

  • 202X年のロボットが夢見る ヒトと機械がつながる社会

    202X年のロボットが夢見る ヒトと機械がつながる社会

  • 文芸評論家で東芝研究者 奥野健男と探る文学と科学の交差点

    文芸評論家で東芝研究者 奥野健男と探る文学と科学の交差点

  • 佐賀市発で世界初 最先端のCO2分離回収プラント

    佐賀市発で世界初 最先端のCO2分離回収プラント

  • 日本人に最適化したゲノム解析ツール 『ジャポニカアレイ®』が拓く未来とは!?

    日本人に最適化したゲノム解析ツール 『ジャポニカアレイ®』が拓く未来とは!?

  • モーターには希少資源が使われていた!? 忘れられた磁石リバイバルへの挑戦

    モーターには希少資源が使われていた!? 忘れられた磁石リバイバルへの挑戦

  • 電子ミラーで車体が透ける? コックピットソリューションの最前線

    電子ミラーで車体が透ける? コックピットソリューションの最前線

  • なんでも接着 なんでもつながる “分子接合”で広がるIoTの可能性

    なんでも接着 なんでもつながる “分子接合”で広がるIoTの可能性

  • ビジネスモデルを変える力 IoTアーキテクチャー「SPINEX」

    ビジネスモデルを変える力 IoTアーキテクチャー「SPINEX」

  • 「ソサエティー5.0」の衝撃 第5の新たな社会とは

    「ソサエティー5.0」の衝撃 第5の新たな社会とは

  • 謎の“ボール消失現象”を追え LED研究者がフィールドを走る

    謎の“ボール消失現象”を追え LED研究者がフィールドを走る

  • スタートアップと大企業が組んだ オープンネイルの“確信”

    スタートアップと大企業が組んだ オープンネイルの“確信”

  • 指先がデバイスになる!? “革新”のオープンネイル

    指先がデバイスになる!? “革新”のオープンネイル

  • AI新時代を生きる― 「技術の東芝」を追い求める研究者たち

    AI新時代を生きる― 「技術の東芝」を追い求める研究者たち

  • 老舗のAI技術を人々の身近な生活の中に ~東芝コミュニケーションAI「RECAIUS™」~

    老舗のAI技術を人々の身近な生活の中に ~東芝コミュニケーションAI「RECAIUS™」~

  • 自動運転を支えるAI ~画像認識プロセッサ「Visconti™」~

    自動運転を支えるAI ~画像認識プロセッサ「Visconti™」~

  • 東芝の半導体工場から世界へ ~AIで社会の最適化を目指す~

    東芝の半導体工場から世界へ ~AIで社会の最適化を目指す~

  • 『AI企業』50周年のその先へ ~東芝が目指すAIとは~

    『AI企業』50周年のその先へ ~東芝が目指すAIとは~

  • 産業用ドローンの新時代 電力インフラ点検で異業種コラボ

    産業用ドローンの新時代 電力インフラ点検で異業種コラボ

  • IoTで変わる!未来エレベーター 柔軟な発想がビジネスのヒントに

    IoTで変わる!未来エレベーター 柔軟な発想がビジネスのヒントに

  • インバウンドサービスで活躍 ビーコン活用 実証実験をレポート

    インバウンドサービスで活躍 ビーコン活用 実証実験をレポート

  • スマホを使って看板を翻訳 インバウンド対応はここまで進化した!

    スマホを使って看板を翻訳 インバウンド対応はここまで進化した!

  • 自動運転、ドローンへの応用にも期待大 単眼1ショットで画像と距離を同時撮影!

    自動運転、ドローンへの応用にも期待大 単眼1ショットで画像と距離を同時撮影!

  • スポーツ映像アナリティクスの最前線 ディープラーニング×画像認識技術の可能性

    スポーツ映像アナリティクスの最前線 ディープラーニング×画像認識技術の可能性

  • ICTの力で戦略立案や選手強化を! 日本ラグビーはさらなる進化へ――!

    ICTの力で戦略立案や選手強化を! 日本ラグビーはさらなる進化へ――!

Archives
  • エネルギー
  • 社会インフラ
  • 電子デバイス
  • デジタルソリューション
  • 研究開発
  • 人・取り組み