人工知能を使った画像解析について詳しく解説
人工知能を使った製品やサービスが広がりつつありますが、その中でも注目されているのが画像解析です。
画像解析とは、カメラやセンサー等から得た画像をコンピュータで処理し、その画像を測定したりデータを分析したりする技術のことを指します。画像解析に人工知能を取り入れることで、自動運転、顔認証などのセキュリティ、工場での製品検査、医療画像による診断など、多様な分野で利用することが可能になってきています。
この記事では、人工知能を使った画像解析について、機械学習やディープラーニングを踏まえて解説していきます。
そもそも画像解析とは何か
人工知能による画像解析の説明を行う前に、画像解析について簡単に説明していきます。
画像解析で行うこと
画像解析で行うことは「分類」と「検出」です。
分類とは、画像に何が写っているのかを判断することです。例えば、犬が写っている画像であれば「犬」、猫が写っていれば「猫」と判断することです。人間にとっては簡単なことですが、コンピュータにとっては犬なのか猫なのか判断することは難しいことなのです。
画像解析における検出とは、何がどこに写っているかを判断することです。例えば、自動運転ではカメラに写っている物体が何でどこにあるかを検出することで、安全に運転することが可能になります。
このように画像解析では、対象物が何であるかを分類し、それがどこにあるのか検出します。
画像解析の流れ
画像解析では、最初にノイズの除去や輝度の調整を行います。画像にブレが生じていたり、コントラストが不明瞭な場合、対象とする領域を抽出することが難しくなります。コントラストを調整したりブレを除去することで、画像解析の精度を上げることができます。
画像のノイズを除去した後、「セグメンテーション」と呼ばれる作業を行います。セグメンテーションとは、画像から必要な部分を取り出すことです。セグメンテーションは、画像を0と1の数値で表すことから「2値化」と呼ばれます。
続いて、「モルフォロジー演算」という処理を行います。モルフォロジー演算によって画像がより明確になります。
セグメンテーション、モルフォロジー演算を行った後、抽出した画像に対して領域解析を行います。形状や面積、向きなどを測定し、分類と検出を行います。
人工知能を画像解析に利用する
続いて、人工知能を使った画像解析について解説していきます。人工知能では、「機械学習」と「ディープラーニング」という言葉がよく出てくると思いますが、これらの違いについてここで明確にしておきましょう。
機械学習による画像解析
ある画像に人間と犬が写っているとしたら、コンピュータはどのように分類すればいいでしょうか? 「人間は2本の足で立っていて上部に頭がある」「犬は4つの足があり、前方に頭、後方に尻尾がある」というように、ある対象物を分類するには対象物の特徴を知る必要があります。
この特徴を数値化したものを機械学習では「特徴量」と言います。特徴量を使うことによって、コンピュータは画像を分類することができます。しかし、機械学習では特徴量の設計を人間が行う必要があり、それが機械学習における最大の問題点でした。
ディープラーニングによる画像解析
ディープラーニングは、コンピュータが自ら特徴量を獲得し、それを元に画像を分類することができます。
人間が何を特徴量とすべきかを決めるしかなかった人工知能の世界において、自ら特徴量を獲得できるディープラーニングは技術的に大きなブレイクスルーでした。
2012年には、「コンピュータが猫を認識できるようになった」とグーグルの研究者が発表して話題になりましたが、あれはYouTubeから取り出した大量の画像をコンピュータがディープラーニングで学習し自ら特徴量を獲得したものです。
ディープラーニングを用いて画像解析を行うことで、エラー率が減少したり、解析時間を短縮することができます。
以上、人工知能の画像解析について解説してきました。人工知能に興味はあるけれど難しそうと感じている方は多いと思いますが、人工知能に関する知識がなくても、ツールやAPIを使うことでコンピュータに学習させることが可能です。
IBMワトソンの「Visual Recognition」は画像認識APIで、大量の画像を分類してタグ付けを行うといったことなどができます。興味のある方は、ツールやAPIから試してみてはいかがでしょうか。
▼キャパの公式Twitter・FacebookではITに関する情報を随時更新しています!