データが主食

データエンジニアのぽえむ。分析だったり、読んだ本のメモだったり。

「AI応用システムの安全性・信頼性を確保する新世代ソフトウェア工学の確立」をつまみ食い

戦略プロポーザルとは?

国立研究開発法人科学技術振興機構研究開発センターというお硬い感じの組織が戦略プロポーザルというものを定期的に報告してくれているようです。

彼らによると

「戦略プロポーザル」は、今後国として重点的に取り組むべき研究開発の戦略や、科学技術イノベーション政策上の重要課題についての提案をまとめたものです。*1

だそうです。

先日、AI応用システムの安全性・信頼性を確保する新世代ソフトウェア工学の確立という戦略プロポーザルが発表されました。 私の仕事にも関係しそうな領域の話だったのでつまみ食いしてみました。

www.jst.go.jp

内容まとめ

背景

  • 機械学習の応用システムは動作を帰納的に定義するので開発が難しく、従来のソフトウェア工学では不十分。
  • 流れに乗れないとシステムインテグレーターは競争力を失う可能性あり。
  • 十分な品質保証が出来ない状態で、社会実装を進めると、問題や事故が起きる可能性がある。

提案

  • 「AIソフトウェア工学」の確立が必要。
  • AIソフトウェア工学技術で国際競争力を確保したい。そのために以下の4つの技術チャレンジをしたい
    • 機械学習自体の品質保証
    • 全体システムとしての安全性確保
    • ブラックボックス問題への対策
    • 問題を効率よく解く工学的な枠組み

個人的に面白かったところ

f:id:ktr89:20181212140217p:plain

この問題の難しさが綺麗に整理されていると感じた。 とはいえ、あまりに完璧なシステムを作ろうという努力に感じていて、少し違和感を感じる。 今までだって、全てのケースでテストすることはなかったはず。例えば、32bit浮動小数を引数として取るような関数のテストのために232通りのテストケースは実施しないように。 塩梅の問題なのかも。

f:id:ktr89:20181211223507p:plain

現時点で、AIが活躍しているのといえば、やはり広告ですね。 データ量が多いという面がよく語られますが、人命に影響がないというところも大事ですね。自動運転等の実験などに比べたら、広告の自動運用の実験は有って無いようなものです。

第三に、AI 品質を日本の強みにして、AI 適用産業の国際競争力を強化することにつながる。AI 応用システムの品質基準・安全性基準が定められていない場合、安価だが粗悪なAI 商品・サービスが他国から国内市場に流れ込むかもしれない。また、単なる価格競争に陥り、品質・安全性に問題のある商品・サービスが市場にあふれて事故が頻発するかもしれない。そのような事故が多発するようであれば、AI 応用システムに対する懸念が高まり、厳しい規制や国内 AI 関連産業の委縮を招くものと考えられる。そのような事態を回避し、市場の健全化と産業の活性化を促進するためには、国として適切な品質基準・安全性基準を定めることが求められる。そのとき、その基準が十分な根拠を持ったものであることや、その基準を満たすようなシステム開発のための方法論が確立されていることが重要であり、国際競争力を生む。その裏付けとなる新しい理論・技術体系が AI ソフトウェア工学の研究開発から生み出され得る。

たしかに、展示会などに行くと猫も杓子もAI状態で怪しいサービスもたくさんあります。それらを評価することには一定の価値がありそうです。

所感

機械学習関連システムの開発が難しいのは日々感じていて、課題感はヒシヒシと伝わってきます。 一方で、この分野では競争力∝データ量だと思うので、日本のソフトウェア工学技術が発展した時に、本当に競争力を得られるのか疑問です。 GAFAMなどはすでにたくさんの機械学習関連システムを開発しているので、ノウハウがたくさんありそうな気がします。

データの無い日本がいまさら頑張って勝てるのでしょうか。