Microsoft Azureコラム

2021/10/08

リライト:手戸蒼唯（てどあおい）

Custom Visionとは？メリットや活用事例を詳しく解説。驚異的な業務効率化も可能

『Custom Vision』は、AIの学習の元となるわずか数十枚の画像教師データのみで、手軽に画像認識・判定AIモデルを生成できます。
また、AI知識のない方でも、さまざまな用途に対応した独自のAIモデルを構築できる優れものです。後ほど紹介しますが、驚異的な業務効率化も可能とするため、ぜひとも知っておきたい技術の一つです。

本コラムでは『Custom Vision』の概要とメリット、その活用方法や事例を詳しく解説します。

Custom Visionとは

『Custom Vision』はAzure Cognitive Serviceの一つで、画像認識に特化したサービスです。使い方はシンプルです。

利用者は「画像データ」と「ラベル」をアップ
『Custom Vision』によって、その２つを元にAI処理を実行
独自AIモデルを簡単に入手

入手した独自AIモデルは「画像分類」と「物体検出」に利用できます。AIモデルをエッジデバイス（インターネットに繋がったデバイス）へ搭載し（これを「エッジコンピューティング」と呼びます）、現場でさまざまなリアルタイムの判定に利用できるのです。
例えば、製造業では不良品の自動判定に、建設業界では現場のビデオカメラから送られる動画を利用した重機の遠隔操作などに活用されています。

通常、ディープラーニング、特に教師あり学習による画像解析には、時には数十万から数百万にも及ぶ大量の良質な教師データが必要です。
しかし、『Custom Vision』を使えば、画像解析に必要な画像（教師データ）はたった数十枚のみです。無駄な画像データ収集や学習期間のコストを省けるのです。

また、Azureのサービスでは他に、事前学習の必要なく利用できる『Computer Vision』もあります。このサービスは、Microsoftがあらかじめ教師データを学習させたAIモデルを利用するため、より簡単に利用できますが、独自AIモデルは作成できません。独自AIモデルを作成したい場合は、『Custom Vision』を利用する必要があります。

『Custom Vision』を利用できるAzureのCognitive Serviceについては、「Azure Cognitive Servicesとは？AzureのIoT向けサービス群での位置づけやサービス内容を解説」に詳しく記載していますので、ぜひご覧ください。

Custom Visionのメリット

『Custom Vision』は、マイクロソフトが用意したAI処理モデルをベースに、独自のAIモデルを構築できるため、大きく３つのメリットがあります。

わずか数十枚の画像でAI処理モデルを教育し構築できる
AIの知識がなくても、高性能なAI処理モデルをすぐに手軽に利用できる
画像認識・判定AIを使用したサービス構築のコストを削減

一つずつ見ていきましょう。

1.わずか数十枚の画像でAI処理モデルを教育し構築できる

昨今、主流となっているディープラーニングをベースとしたAI処理モデルには、構築にあたって「膨大な学習データ」という大きな壁があります。
特に教師あり学習については、数十万～数百万といった量の良質な画像データが必要になります。この良質な画像データの収集やラベル付けといった作業には多くのコストがかかります。

『Custom Vision』は、マイクロソフトが用意しているAI処理モデルをベースにしているため、最小5枚から画像データを取り込むだけでも独自のAIモデルを作成できます。画像データの収集やラベル付けというコストを大幅に削減できます。

2.AIの知識がなくても、高性能なAI処理モデルをすぐに手軽に利用できる

AI処理モデルの構築には、もう一つ「AI関連の専門知識習得」という大きな壁があります。AIを稼働させるには、AIの専門知識はもちろんのこと、プログラミングや学習を実施するインフラの設計など、幅広い知識が必要になります。

しかし、『Custom Vision』ならば、マイクロソフトが提供しているAI処理モデルをベースに、すぐにAIの学習を開始できるため、AIの知識がなくても利用することができます。

3.画像認識・判定AIを使用したサービス構築のコストを削減

一般的に画像認識・判定AIをゼロから構築するには、AIの専門家やアプリケーション構築担当、インフラ設計担当など、多数のスペシャリストが必要です。加えて、膨大な学習データの準備に人員を割くことになります。
しかし、『Custom Vision』を使用することで、ここまで記載してきたメリットにより、大幅なコスト削減が可能です。画像検出を気軽に利用できるようになるため、さまざまなサービスの立ち上げに積極的にチャレンジできるでしょう。

Custom Visionの機能

冒頭で記載した通り、『Custom Vision』で作成できるAIモデルには大きく分けて「画像分類」と「物体検出」の2種類があります。それぞれの内容について見ていきましょう。

画像分類

画像分類の機能は、読み込んだ画像の物体を判別するような処理で活用します。例えば、製造業では不良品の自動判定に利用可能です。画像に良品（OKパターン）もしくは不良品（NGパターン）のタグ付けを実施し、『Custom Vision』に読み込ませることで学習させられます。学習には、1タグあたり画像5枚以上が必要です。

イメージしやすいように下記の実験をしています

■ヒューズの配線(配置)パターンの正誤を判定するAIモデルを作成

学習用画像データ

OKパターン 30枚、NGパターン 35枚の画像データで学習
NGパターンとして、ヒューズの順番違い、ヒューズ抜けなどの画像データを用意

学習データイメージ

学習させたAIモデルに期待値「OK」と「NG」のものを読み込ませて判定させた結果

物体検出

物体検出は、画像の中から検出対象の物体を判定します。検出したい電子部品の画像を『Custom Vision』に学習させておくことで、電子部品の個数や画像内の座標情報を取得できます。学習には、1タグあたり画像15枚以上が必要です。

画像分類がAIモデルの画像との近しさを判定するため良品・不良品の判定に利用されますが、物体検出は対象物の数量や位置を判定するため、出荷梱包が正確にできているか、などで利用できます。

画像分類と物体検出の利用イメージ

Custom Visionの導入事例

すでに『Custom Vision』は、製造現場でも導入が進んいます。ここでは、建築現場と工場での導入事例を見ていきましょう。

建築現場の進捗管理をAIと動画で実現

建設業界では、国土交通省が提言する「i-Construction」（「ICTの全面的な活用（ICT土工）」等の施策を建設現場に導入することによって、建設生産システム全体の生産性向上を図り、もっと魅力ある建設現場を目指す取組）のもと、建設現場のICT化を推進しています。i-Constructionの事例としては、例えば、現場のカメラから送付されてくる動画を利用した重機の遠隔操作や、ビーコンによる危険区域へ近づいた際のアラーム発報などが挙げられます。

こうしたICT化の波は、建設現場の進捗管理にも及んでいます。とある建設会社では、『Custom Vision』を利用した画像解析による工事進捗管理システムを構築しました。従来は、職人の経験と勘に頼らざるを得なかった現場の進捗管理を、AIで完了率など数値化することに成功しています。
迅速なシステム構築の秘密は、『Custom Vision』の「学習の早さ」にありました。その速度は、通常1日かかるようなデータ量でも、1 時間程度で学習を終えられるほど。「学習があっという間に完了することによって、検証に多くの時間を割けた」と担当者は語っています。

実際の現場では、AIの検出率100％は中々ハードルが高いのですが、70～80%の精度があれば、進捗度の把握はできるようです。AIが問題を検出した際に、問題点を探す作業は人間が担うことで、進捗管理工数を削減し、技術者が現場に出向く回数も1日6回だったものを4回に削減できています。AI精度が上がればさらに回数削減につながるかもしれません。

また、これまでは現場の工事が予定通り進んでいない場合も次の工事のために人やモノが準備され、待機することが多かったのですが、完了予定をおおまかに把握できるようになり、待機時間も、平均15分～5分程度と大きく短縮できました。

工場における製品の自動判別に活用

『Custom Vision』を利用し、工場で作られる製品の自動判別ができるようになります。

例えば、製品の良否判定や数量のカウント、梱包作業の不足品や部品の入れ間違いなども検知できるようになるでしょう。『Custom Vision』は数十枚からの画像でAIモデルを学習させられるので、準備も効率的に実施できます。
また、異常状態が判別できるようモデルを作成し自動化することにより、チェック人員を他の業務にシフトできます。エラーが出た際の原因究明に人員を割くだけで十分になります。

Custom Visionの料金について

Custom Visionの料金は従量課金で、次の4つの内容で決まります。

学習に使用した画像の枚数(アップロード枚数)
トレーニング操作にかかった時間
クラウド側での画像データの保管費用
AIの実行回数(API呼び出し回数)

そのコストはたったの数百円となることもあります。
とある電子部品のチェックを実施するAI処理モデルを1モデル作る際に、画像3千枚を20分で学習させたと仮定すると、AI処理モデル構築時に発生した費用は約1,142円、運用時に発生した画像データ保管費用は約236円/月と非常にリーズナブルです。これだけのコストで済むならば、さまざまなシーンで気軽に『Custom Vision』を試すこともできるでしょう。

Custom Visionの料金の詳細は、「Cognitive Services の価格 - Custom Vision Service」で確認できます。

Custom Visionの基本的な使い方

『Custom Vision』の使い方は簡単で、画像を準備し、Azure上のサービスでプロジェクトを作り、画像をアップロード後にタグ付けして学習させるだけです。
AI処理モデルを構築した後は、簡単なテストもできます。『Custom Vision』で作成したAIモデルはクラウド上に配置され、専用のURLが割り当てられます。このURLに対し、推論させたい画像データをREST APIで送信すると、推論結果(解析結果)がJSONで戻ってきます。

まとめ：Custom Visionで気軽に柔軟な画像解析を可能にし、業務を効率化しましょう

本コラムのまとめです。
『Custom Vision』はAzureのCognitive Serviceの一つで、画像認識に特化したサービスモデルです。独自の画像データをAI処理し、「画像分類」と「物体検出」を行います。マイクロソフトが用意している高性能なAI処理モデルがすぐ利用でき、わずか数枚～数十枚の画像で教育が完了します。一からAI処理モデルを構築する場合に比べ、非常に低コストで画像認識・判定AIモデルを生成可能です。
コストも構築費用、月額運用費用ともに数百円からと非常にリーズナブルで利用しやすくなっています。さまざまな場面でぜひ『Custom Vision』を気軽に柔軟に活用していきましょう。

東京エレクトロンデバイスでは、紹介したような事例で利用できる「画像判定AIソリューション超簡単導入パッケージ」を販売しています。『Custom Vision』によるAIモデルの作成代行および精度評価をご支援するサービスパッケージです。
「『Custom Vision』を導入したいけどまずはどうしたらいいかわからない...」というお悩みがございましたら、ぜひ『画像判定AIソリューション』をご覧ください。

技術的により詳しい内容を知りたい方は、 Azureのプロからの有効活用アドバイスをご紹介するテクニカルブログを公開しています。

プロから学ぶAzureテクニック「Azure Cognitive Servicesの各種サービスをWebアプリから利用する」（CSPテクニカルサポートサイト「CP-TechWeb」にリンクします）