TOP
Technology
発想の転換が導いた世界最高精度の新常識！【後編】　～最小枚数で高精度の画像認識を実現

発想の転換が導いた世界最高精度の新常識！【後編】　～最小枚数で高精度の画像認識を実現

印刷する

2022/12/21　Toshiba Clip編集部

この記事の要点は...

「Few−shot物体検出AI」なら、データが多くない企業でもDX推進が可能！？
「異常箇所検出AI」は、異常を過剰検出する課題へ逆転の発想でアプローチ！
東芝のAI開発を支える、50年以上の歴史と、尖った専門性を持つ人材たち。

発想の転換が導いた世界最高精度の新常識！【後編】　～最小枚数で高精度の画像認識を実現

近年、ますます注目されている画像認識AI。AIが精度高く画像を認識するためには、通常大量のデータを用意する必要がある。そんな課題を解決するカギとなった技術が、東芝が開発した世界最高精度の技術「Few−shot物体検出AI」と「異常箇所検出AI」だ。前編ではこの２つの特徴と、社会に与えるインパクトについて触れた。

後編では、それぞれの技術開発の裏側に迫る。研究開発時のブレイクスルーと、社会課題を解決するために、どのような価値を提供するのか。AI研究を50年以上続けてきた東芝ならではの強みについて、最先端のAI開発を担うキーマンである2人に話を聞いた。

画像データが多くない企業でも、DXを推進できるように

世界でも10本の指に入るAI特許出願件数を誇る東芝。50年以上の研究開発が裏づける技術力は、音声・言語、画像、分析と多くの領域に渡る。今回のテーマである画像認識AIに関しては、1967年には手書き数字の認識を実現している。これは、世界最高精度の「郵便番号自動読取り区分機」に採用された技術だ。

東芝研究開発センターで、鉄塔など社会インフラの「異常箇所を検出するAI」を開発した河村氏は次のように、“AIの東芝”について語る。

「顔認識や物体検出にしても、過去、何十年と蓄積したノウハウがあるのは東芝の強み。それが、人材の力を生かす優位性にもつながっています」（河村氏）

株式会社東芝研究開発センター知能化システム研究所メディアAIラボラトリー河村直輝氏

そのノウハウや人材は、どう世界最高精度の大量データを必要としない画像認識AIを生んだのか？「異常箇所検出AI」と「Few−shot物体検出AI」の開発秘話について、それぞれ深堀りしていこう。

まずは、「Few−shot物体検出AI」の開発。AIに限らず、東芝の研究開発では、顧客のニーズと課題に寄り添うのが特徴だ。今回も例に漏れず、やはりきっかけは、顧客からの「ある声」だった。河村氏と同じラボに所属する小林氏は、次のように振り返った。

「このプロジェクトは、矛盾を解決するために始まりました。『AIに未知の物体を検出させたい』と、多くのお客様は望まれます。それは、現場の状況を画像認識AIでデータ化することで業務を効率化し、その先のDXを実現したいからです。

しかし、教師データと呼ばれる、AI開発に必要なデータ収集に手間とコストはかけられない。この矛盾を解決したのが、少ないデータでも学習可能な『Few−shot物体検出AI』です」（小林氏）

株式会社東芝研究開発センター知能化システム研究所メディアAIラボラトリー　小林大祐氏

「Few−shot画像検出AI」は、従来の検出精度の2倍！

さて言うはやすしだが、実際に少ないデータで画像認識AIを開発するのは非常に難しい。不可能と言っていいくらいだ。そのため開発で最も求められたのは、「どのようにAIに画像を認識させるか」という、そもそもの発想の転換だった。小林氏は、当時を次のように振り返る。

「どういう考え方なら課題を乗り越えられるかを別の研究をしている同僚と相談するなかで、アイデアが降ってきました。新しい発想を掴んでからは、アイデアが整理され、開発もスムーズに進みました。

具体的には、教師データとなる物体だけを検出対象とするのではなく、これまで「背景」として扱われていた領域にある物体も含めて、「検出対象として」学習する仕組みへ変えました。すると、検出精度は21.2％から46.0%へと大幅に向上しました」（小林氏）

「Few-shot物体検出AI」は物体候補をすべて検出し、目的の画像と照らし合わせる

つまり、唯一の正解を探しにいく方法ではなく、「正解っぽいもの」にあたりをつけておいて、そこから本当に検出したい対象と照らし合わせて特定するようにしたのだ。これは、一体どんなインパクトをもたらしたのか？この技術の意味合いを、小林氏は次のように整理する。

「様々な種類の部品や設備を扱う工場やプラントで『Few−shot画像検出AI』を使えば、従来のように大量のデータを用意しなくても目的の物体を検出できます。これは、これまで現場の状況をデジタルに把握できなかった企業が、DXで価値創造するきっかけになると思います」（小林氏）

「異常箇所検出AI」は、逆転の発想で開発

次に、「異常箇所検出AI」を開発した河村氏に話を移そう。社会インフラを手掛ける東芝は、主力取引先である大手電力会社から点検時の課題について相談を受けていた。この“困りごと”を前に、河村氏の開発者魂が騒いだ。

「鉄塔など屋外にあるインフラは風雨などに晒され、固定された環境にはありません。また敷地が広大で確認に手間がかかり、場所によっては目視できない。そういった過酷な場所では、ドローンやヘリを使って点検を行いますが、必ずしも異常を確認できる写真を撮れるとは限りません。

そもそも公共性の高い社会インフラでは、間違いが許されません。言い換えると、点検で検出するべき異常データを集めにくいということです。そんな中でも、どうにかして少ない写真枚数や、傾きなどが不確かな画像でもAIで異常箇所を見つけられないか？というご相談が、プロジェクトの始まりでした」（河村氏）

実は、「異常箇所検出AI」の考え方は、すでに多くの論文で発表されている。しかし、そのどれもが、正常箇所も異常と判断する過剰検出が大きな課題になっていた。今回のプロジェクトでも、大きな壁として立ちはだかる。これまでは、正常箇所を異常と判断した場合は、技術に問題があるとして採用を見送っていた。しかし、河村氏は違う。

「過剰に検出してしまうならば、そこを引き算すれば良いのではないか」と考えたのだ。この逆転の発想を生み出したのは、河村氏が以前に研究していた顔認識AIの知見である。

「顔認識AIでは、似た人をどう見分けるかが重要です。AIは何百もの特徴点から人物を特定するので、別人を同一人物とみなす誤認識は、同じような特徴があることで発生します。だったらと思い、その箇所を無視するAIを開発したことがありました。その知見を今回も活用しました。

例えば社会インフラに適応すると、集めてきた正常画像でも、明るさ、影などが違っています。見え方が違うと『異常』としてしまうので、その異常度合いを小さくする計算式をつくりました。その結果、認識精度は91.7％と世界最高水準に達しました」（河村氏）

正常画像の過剰検出を抑制して、異常箇所を適切に検出

山岳地の鉄塔、橋梁の高架下、太陽光パネルなどへの適用を期待

それでは、「異常箇所検出AI」はどのように活用されるだろうか？例えば、ドライブレコーダーやドローンの撮影では、物体が多様な位置や向きで映る。それらをAIがすべて異常とするので、これまでは使いものにならなかった。「異常箇所検出AI」が実用化すると、ドライブレコーダーやドローンのデータでも活用できるはずだ。

今回の開発のポイントは、法定点検などで撮った正常画像を数枚準備するだけで良いところだ。その後は、ドローンなどで撮った点検画像と比較すれば、異常箇所をすみやかに検出できる。危険や移動の負担が伴う山岳地の鉄塔、橋梁の高架下、太陽光パネルの裏面など、点検の無人化、省力化が求められる現場への適用が期待できる。さらに、これまで収集が困難だった異常も高精度に検出でき、早期発見につながるという。

「社会インフラだけでなく、農場など似たような構造物が膨大に並んでいる場面は正常パターンも入手しやすいので応用が利くと思います。まだ研究段階ですが、何かを画像で比較するニーズには色々と使えるはずです。流通など様々なお客様と協力し、実証実験を重ねて技術を高めていきます」（河村氏）

「東芝のAI」を支える、数十年に及ぶ歴史と人材の厚み

上述のように、「Few−shot画像検出AI」と「異常箇所検出AI」は、すでに多くの論文がある技術だ。しかし、東芝は現場での実装を見据えた開発を実現している。その理由は、東芝のAIに対する姿勢と積み重ねた歴史にある。

小林氏は研究所を「専門店の集まり」と形容する。社内の事業部、社外の顧客に使ってもらう技術をウリにしないと、存在意義がないという意味だ。

「研究所は事業部とつながり、常に現場の課題を把握しています。もちろん、我々の技術を実際に使ったときのフィードバックも頂きます。現場にはどういう技術が足りないかを捉え、いかにより使いやすい技術にするかを考え、研究開発しています。

実装はされなかった技術もたくさんあり、論文では評価されても現場の制約で使えないという苦い経験の蓄積が今につながっています。お客様に上手く使ってもらうにはどうすればいいのか。ここに我々のモチベーションがあります。現場の人に喜んでもらえたときが、最も達成感を覚えますね」（小林氏）

人材の優位性について、小林、河村の両氏は「研究者が居心地のいいラボ」と口を揃える。今回の二つの技術は、二人の大きな才能があったから実現したといっていいが、その背景には専門家（店）どうしのディスカッションが生きているという。

「Few−shot物体検出AI」と「異常箇所検出AI」の開発チーム。議論しやすい環境が新たな発想を生む。

「東芝のラボには、大学の研究室で活躍できる実力者が溢れています。別々の研究をしながらも、ちょっと息詰まると議論し、次々と突破口を掴めます。レベルの高い技術者が多いため、議論が楽しいし、新しいアイデアにつながります。

異常箇所検出AIの開発では、今まで関わらなかった分野で使える技術を提案できました。これからも、様々な分野に対して挑戦し、使いやすい技術で色々な事業に貢献します」（河村氏）

「私も河村さんも、1年目から責任を持った研究開発を任されました。年齢に関係なく、熱意とまっとうな意見があれば挑戦できる環境ですね。

精度が高いだけでなく、社会というシステムの中で、どの部分に役立てるAIなのかを常に考えています。現場の声を聞き、社会の課題をすくい上げ、ユーザーにとって使いやすい技術を作り続けていきます」（小林氏）

長いAI開発の歴史をもつ東芝に、新たな1ページを刻んだ「Few−shot画像検出AI」と「異常箇所検出AI」。少ない画像で世界トップレベルの精度で物体や異常を検知する技術を現場に実装する道筋を立てられたのは、東芝でAIに携わる人材の類い希なる才能と厚み、そして、その才能を育む現場主義の環境があった。この土壌が東芝の新たなAI技術開発を下支えし、社会のDXを推進していく。

「Few−shot物体検出AI」と「異常箇所検出AI」の開発チーム。