IT is IT.

空想イノベーション

畳み込みニューラルネットワークの「畳み込み」とは何なのか

f:id:itry:20190217213659j:plain
そもそも畳み込みとは、カーネルと呼ばれるフィルタを用いて画像から特徴を抽出する操作をさす。
特徴の抽出は、フィルタを画像の左上から順に重ねあわせていき、画像とフィルタの値をそれぞれ掛け合わせたものの総和をとった値を求めていく、という処理を行っていく方式で行われる。
このフィルタは、通常、画像よりも小さいサイズのものが用いられ、1枚の画像に対し、いくつものフィルタを用意することになる。
フィルタの数値によって、得られる特徴が変わることから、通常のニューラルネットワークにおける重みと同等の働きをするもの、と考えてよい。

スポンサーリンク
 

畳み込みの処理によって、移動不変性の獲得も可能になる。
これは、多少のずれでも人間の目には同じ物体として認識できるが、通常のニューラルネットワークでは入力の位置がずれることで全く別物と 認識してしまうが、畳み込みでは、同じものと認識できる移動不変性、つまり位置のずれに強いモデルができることを意味している。

また、畳み込みによって得られる2次元データを、特徴マップと呼ぶ。