AIによる外観検査ということに取り組み始め3年が経過しました。
わずか3年前は、MENOUの事業を説明する際、「AIとは?」「ディープラーニングとは?」「機械学習とは?」「ルールベースの画像検査との違い」など本当に基本のキからお客様にご理解頂いていたのが普通の世界でした。
ところが最近では、AIによる画像検査は当たり前となりつつあり、学習コスト、ランニングコストや検査速度(タクトタイム)、モデルの更新など使用するうえでの課題についてご質問されたり、ご相談を受けるケースが増えてきています。
今回は特に「学習コスト」と「検査速度」にとっても効果のあるMENOUの独自技術である「タスクコネクション」について解説したいと思います。
まず、そもそも「学習コスト」というのは「AIが賢くなるのに必要なコスト」という意味です。残念ながらAIというものは、データを与える前は何もできない「使えない」AIです。しかし、人間がせっせと不良品の場所や、不良品の分類方法などを丁寧に教えて(教示)あげることでAIも一人前になり、「使える」ようになっていきます。なるべくこの学習コストを小さくしながら「使える」AIに仕立てることがカギとなるのです。
さて、この「学習コスト」ですが、3つの要素でできています。
1つが、撮像です。
2つ目がアノテーション(ラベリングとも)です。
3つ目が、やり直し(チューニングとも)です。
つまり、学習コストを下げるためには、少ない枚数で学習し、アノテーション枚数も減らせるようにすることが大切です。次に、学習したモデルが充分な精度を発揮し、やり直しを防ぐことです。やり直しを防ぐために、学習させる枚数を増やしたくなるというジレンマが生じます。少なめの枚数で学習しておいて、精度が不十分なら枚数を増やしていくのが基本的には良さそうです。しかし、どのような画像をどの程度増やすべきなのか、というのは案外難しい問題で、精度不足の原因を理解しなくてはいけません。
AIの精度が悪くなる最大の原因が「特徴量の抽出が甘くなる」からです。画像から効果的に特徴を抽出するには、良品と不良品の違いとなる特徴を画像から見つけ出す必要があります。その際、人間は意識なく自然に視野に入っている背景といった「意味のない」情報を最初から排除していますが、AIは画像にあるすべてのピクセルを同じ重みづけで学びとろうとします。そのため、大事な情報が薄まってしまうということが起き、特徴を見つけ出すのに多くの画像枚数が必要となってしまうのです。
特に、高解像度の大きな画像から小さな欠陥を見つけようとするなら、無視するべき情報の方が遥かに多いのにも関わらず、何を無視するべきなのかを知るために膨大な画像とアノテーションが必要になってしまうのです。検査にとって意味のあるピクセル数をSとし、意味のないピクセル数をNとすると、S/N比が小さければ小さいほど、AIの学習コストは上がる傾向にあります。
動物の写真から犬や猫を識別するようなディープラーニングであれば、動物が画像の大半を占め、耳や体形、模様などの特徴も画像の多くの範囲に登場しますので、S/Nは比較的大きく、通常の学習アルゴリズムで学習することができます。
しかし、大きな製品に存在する小さな欠陥や、顕微鏡下でしか見えないような欠陥など、対象物にとって小さな欠陥を見つけようとすると、多くのAIは苦労するようです。(実際にはアノテーションをするエンジニアの方が苦労します。)意図的に欠陥を作り、何百枚、何千枚もの画像を取得し、すべてに対してアノテーションをするのは骨の折れる作業です。省力化を目指してAIを導入しようとする割に、撮像とアノテーション作業では人海戦術を取ってしまっているケースが散見されます。学習や推論自体も大規模なモデルとなってしまい、膨大なコンピューティングパワーを必要とし、検査速度も遅くなります。
S/N比が大きいAIにはもう一つ大きな欠点があります。それは、「ブラックボックス化」です。AIの抽出した特徴が何にあるのか、どのような画像に反応したのかが非常に分かりにくくなってしまうのです。そのため、やり直しの工程においても手探りでモデルを改良することになり、ただやみくもに枚数を増やしてやり直すという作業に陥ってしまいがちです。アノテーションの質が悪い場合にも、ノイズになりますので、アノテーションし直しが発生することもあります。
そのような問題を防ぐには、タスクコネクションが効果的です!
タスクコネクションとは、S/N比が大きくなるように、AIの学習範囲をステップごとに指示することができるという画期的な考え方なのです。
これまで挙げてきた、S/N比が低いことによって起きていた:
① 画像枚数が増えてしまう ②アノテーション作業量が増えてしまう ③やり直しが大変 という3つの苦労がなくなるのです!
S/N比というと難しいかもしれませんが、我々人間なら当たり前のように行っている考え方です。例えば、製品を俯瞰して大きな欠陥を探し、さらに機能的に大事な部位には意識的にズームインして、注意して見るといったことができます。私たちがMENOUの開発に着手したとき、S/N比といった技術的な要素も気にしたのですが、実は部分的に注目したり、俯瞰したりといったベテラン外観検査員と同じようなことができることを重視しました。