TOP
Use Cases
東芝のAI、作って終わりから次のステージへ　～AIの学習サイクルを自動化する「MLOps」構想

東芝のAI、作って終わりから次のステージへ　～AIの学習サイクルを自動化する「MLOps」構想

印刷する

2022/02/10　Toshiba Clip編集部

この記事の要点は...

作りっぱなしにしない。社会に実装されたAIに対する責任とは？
「人の手」に頼っていたAIの学習サイクルを自動化させる「MLOps」?!
「MLOps」が加速させるAIアイデアの実証、その意味合いとは？

東芝のAI、作って終わりから次のステージへ　～AIの学習サイクルを自動化する「MLOps」構想

私たちの生活に欠かせないスマートフォンのアプリ。自動更新に設定しておけば、使いやすいアプリであり続けてくれる。そしてAI（人工知能）も身近な存在となり、商品の販売予測や、カメラの人物認識などで活躍している。だが、その性能は自動では維持・向上されず、人手に頼っているのが現実。これでは段々と予測が外れたり、誤って認識されたりと嫌な可能性が出てくる。この問題を解決し、AIを私たちにとって「意味のある存在」にするのがMLOps（Machine Learning Operations）だ。このMLOpsの仕組みと、それによるAIの社会実装について、最先端のAI研究者が分かりやすく教えてくれた。

AIは、作った「後」にこそメリットと責任が生じる

AIの研究・開発で50年以上の歴史をもつ東芝。その累計特許出願数は、IBM、マイクロソフトに次ぐ世界3位^※。今、基礎研究の次、信頼に耐える品質をどのように担保するか、という段階へ一歩進む。それは、作るだけで終わらず「AIの社会的責任」を果たすためだ。そこで期待されるのが、「MLOps」というプラットフォーム。これは、AIの開発担当と運用担当が連携し、AIの実装から運用までを円滑に管理するものだ。東芝は、「MLOps」によって作った「後」もAIの性能を維持・向上させようとしている。

※世界知的所有権機関(WIPO)発行「WIPOテクノロジートレンド2019」

東芝研究開発センターの山田正隆氏は、東芝のDXを推進するデジタルイノベーションテクノロジーセンターと共に、「MLOps」の開発プロジェクトをリードする。この最先端のAI研究は、言わば「Ready（準備）からのTake Off（離陸）」。山田氏は、その意味について次のように語る。

「私たちの社会にAIが実装され、ちゃんと意味のあるソリューションの提供に向けて、東芝は準備が整ったということです。もちろんAI技術を磨き続けますが、郵便物の宛名・番号の画像認識など既に一定の水準を満たしています。その他にも音声認識、データ分析・予測などの技術を蓄積しており、多方面で開花しています」（山田氏）

株式会社東芝研究開発センター知能化システム技術センターＡＩ基盤技術開発部　エキスパート山田正隆氏

自動運転の普及など、私たちの社会にAIがますます必要になることは容易に想像がつくだろう。ただし、AIはデータを「学習」して作られる。したがって最新のデータを与え、AIを更新しないと意味のあるソリューションにはならない。「本来の機械学習の真髄は、“実装後”にあるはずです」と鋭く現在の課題について山田氏は指摘する。

「AIは常に性能を維持・向上させてこそ真価を発揮し、経済的にも社会的にも価値を高めます。ところが、現状の機械学習のサイクルは、まだ人手に依存している状況です。例えば、AIの不具合を発見するのは人間で、改善を行うのも人間です。これでは導入後の改善スピードは上がりせんし、コストに跳ね返ります。

そこで、『MLOps』というプラットフォームです。『MLOps』の上でAIを開発・実装すれば、機械学習のサイクルを自動化させられ、品質も担保できます。つまり、私たちがAIから得るメリットを継続的に最大化するのが『MLOps』です」（山田氏）

「画像認識」でトップを走る東芝が、「MLOps」実証実験で得たもの

「MLOps」を一言で表すと、機械学習のサイクルを円滑にするプラットフォームだ。AIの開発と運用を協調させながら進め、AIの性能を継続的に維持・向上させる。例えば、①AIが推論サービスを提供し、人々がメリットを受け取るかたわら、②モニタリングで予期しない異常データも検知するようにし、③そのデータを基にAIに再学習させる。そして、①に戻って推論サービスの性能を現実にそったものにすると同時に、④新しく得たデータや過去のAIモデルをデータ基盤に蓄積しておく。これら①～④を自動的に回すのが「MLOps」で、まさに機械学習（Machine Learning）のサイクルを円滑（Operations）にするものだ。

AIの性能を自動的、継続的に維持・向上させるMLOps（Machine Learning Operations）の仕組み

「MLOps」を標準的なプラットフォームとするため、東芝は実証実験へ駒を進めている。その一例が、山田氏の研究開発センターと、前述のデジタルイノベーションテクノロジーセンターが、2021年7月15日から2週間行った、東芝の社員食堂における実験である。ここでは、画像認識AIが食堂の利用者を検知し、人の流れや混雑度を計測した。実験の目的は、「MLOps」を活用してAIの推論の精度をモニタリングし、通常とは異なる成績が続いた際にきちんとアラートが出るかの検証だ。そのため、逆光やハレーション、障害物、通信ノイズなどのトラブルをわざと起こして、「MLOps」のモニタリングが十分に機能し、どこまでサイクルが自動化できるかを徹底検証した。

MLOpsを検証した実験の概要

この実験の最大の成果は、異常検知のアラートはもとより、AIの再学習を「MLOps」が自動化できたことだ。画像認識の専門家としてAI開発に携わり、2021年から「MLOps」によるPoC^※を推進している東芝研究開発センターの丸山昌之氏は、今回の実験について次のように解説した。

※Proof of Concept：新たな概念やアイデアの実現可能性を検証、確認すること。

「画像認識は、想定外の要素がAIのアルゴリズムに影響を与えやすい領域です。すなわち、ノイズに対してAIが誤った判断をしてしまうバイアスの問題が、特に顕著に見られるということです。そのため今回の実験では、ノイズをノイズとして『MLOps』がきちんと認識してAIの再学習に生かせることが重要であり、また難しい所でもありました」（丸山氏）

株式会社東芝研究開発センター知能化システム技術センター AI応用推進部　スペシャリスト丸山昌之氏

別の言い方をすると、AIを利用する上ではノイズの原因を、「外部環境の影響なのか、AI側の問題なのか」を切り分けることが重要になるのだ。AI技術者であればすぐに判断できても、ユーザーからの情報を元に対応すると、時間と工数が必要以上にかかる。また、十分な検証を行ったAIでも、本番環境では想定外のデータが収集されることも多々ある。そのたびに現場に行き、AIの再学習を行っていては人手がいくらあっても足りない。だから、丸山氏は次のように言うのだ。

「今回の実験で、『MLOps』というプラットフォーム上で再学習の自動化までを確認できた意義は大きい。いち早く気づき、いち早く修正できるからです。特にアイデアの実現性の検証を推進する立場からすると、AI技術者の負荷を軽減できるという意味でも前進したと言えます」（丸山氏）

忘れてはならない、「MLOps」のデータ管理基盤！

加えて重要なのは、東芝の「MLOps」がAIの開発を効率化する「データ管理基盤」としての可能性も示したことである。先の実証実験において、前回学習時との違いやデータのスペック、AIのバージョン管理など、データの再現性を担保できたからだ。「データ管理基盤」に踏み込んだ「MLOps」は、世界でも先進的な取り組みといえる。

これは、AIを実装した後に起こり得る普遍的な課題の解消が視界に入ったことを意味する。例えば、AIが推論するデータの特性が時間の経過にともなって予期せず変化し、精度が落ちることがある。この時にデータ管理基盤があれば、どの時点でデータの特性が変化したかが分かり、早く再学習させられる。AIの精度を低下させないためには、ノイズと精度のモニタリングが課題だったが、「データ管理基盤」という機能を備えた「MLOps」はさらに一歩踏み込んだといえるだろう。

「今回の実験は、『MLOps』によって技術者どうしが知見を共有するという点で、光明が差してきたと感じています。データ管理基盤の機能が向上すれば、時間・コスト・労力を含め、アイデアを実証する負荷は大幅に軽減されるはずです。東芝のAIの社会実装は『MLOps』によって新たな段階を迎え、領域を問わずに加速していくでしょう」（丸山氏）

AIの実装環境に合わせて、学習サイクルを回す

川崎の実験はオンプレミス環境（インターネットのクラウドではなくユーザー施設内に実装すること）で実施されたが、東芝では当然、クラウド環境でのAI適用も想定している。いずれも長所短所がある。クラウド環境は高い処理能力を発揮できる反面、通信遅延などが想定され、個人情報などを含むデータを処理することに対してセキュリティリスクを懸念する声がある。一方オンプレミス環境では、現地でデータを処理するのでリアルタイム性、個人情報保護の点で堅牢性は高いが、高度なデータ処理を行うとなるとコストが問題になる。それでは、AIの学習サイクルを促進するプラットフォーム「MLOps」はどうだろうか。

「オンプレミスとクラウド、言い換えれば現場とインターネット、AIの実装環境はケースバイケースで選択されていくと考えています。その点、『MLOps』自体は、AIのアルゴリズムを規定するのではなく、学習の手順を管理するものなので、その機能は基本的にインフラに依存しません。また特定のクラウドに依存しない構成としているため、同じAIをオンプレミスでもクラウドでも管理することができます」（山田氏）

AIは、ビジネスや社会のあり方を変える手段として大きな期待を背負う。だから東芝では、組織を横断してAIの新たな境地を拓こうとしている。例えば、AIの品質を標準化するガイドラインの協議が始まっている。また今回の「MLOps」は、IoTやセンサーといった「どうデータを取るか」といった領域でも、他の技術者、事業部と連携を深め、切磋琢磨している。

AIの学習サイクルの最適化へ、新たな解をもたらすプラットフォーム「MLOps」。創業から約150年という歴史の中、社会に合わせて進化してきた東芝の知見が、そこに融合されていく。社会に必要とされるAIの開発、そして品質の継続的な担保を含めて社会的責任を全うする「AIの未来」が待っているに違いない。