IT is IT.

空想イノベーション

画像処理の締めは全結合層で!はもう古い?!

f:id:itry:20190220230629j:plain
畳み込み層やプーリング層を複数組み合わせることで、複雑な処理が行えるようになるが、これらの層をいくら組み合わせても、出力は画像でしかない。
たとえば、犬や猫などの画像を与えたときに欲しい解は、画像ではなく犬や猫であることを識別できたことである。
つまり、出力を1次元化する必要がある。

畳み込みニューラルネットワークでは、畳み込みやプーリングを繰り返した後、通常のニューラルネットワーク同様、隠れ層、出力層へと繋いでいく
この、最後の隠れ層、出力層に繋ぐ箇所を、全結合層と呼ぶ。

これは、畳み込み層、プーリング層での特徴の抽出精度が高いためだ。

スポンサーリンク
 

しかし、最近では、全結合層を使用しない手法が増えている。
1つの特徴マップに1つのクラスを対応させる、というGlobal Average Pooling(GAP)と呼ばれる手法だ。
具体的には、各チャンネルの画素の平均を出力する、という手法だ。