IT is IT.

空想イノベーション

畳み込みニューラルネットワーク

f:id:itry:20190216163019p:plain
畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)は、画像をそのまま2次元のまま入力することができるモデルである。

本来画像とは、画像データの縦横の2次元であるが、そこにRGBやHSVといった色に関する情報を持つため、数値情報としては3次元になる。
通常のニューラルネットワークでも画像を扱うことはできるが、この縦横に並んでいる画像を分解して、縦一列の情報に変換することで処理を可能にしている。
当然、この状態になっても処理することはできるが、画像が本来持っている縦横の位置情報が失われることにより、学習の効率が低下することが容易に想像できる。

スポンサーリンク
 

そのため、縦横の2次元の状態を維持しながら処理できる畳み込みニューラルネットワークが、画像分野における機械学習の定番となっている。
画像処理は、ディープラーニングの中でも特に研究が活発に行われており、畳み込みニューラルネットワークでもたくさんの種類のモデルが考案されている。