画像生成のための深層生成モデル

f:id:itry:20190226221523j:plain

変分オートエンコーダ

変分オートエンコーダ（Variational AutoEncoder：VAE）は、可視層と隠れ層からなるオートエンコーダを活用した画像分野における深層生成モデルである。
変分オートエンコーダでは、入力を固定された表現に圧縮するのではなく、統計分布に変換することで、平均と分散を表現するように学習する。
そこから、ランダムにサンプリングそた点をデコーダによって復元することで、新しいデータが生成される、という仕組みになっている。

敵対的生成ネットワーク

敵対的生成ネットワーク（Generative Adversarial Network：GAN）は、ジェネレータ（Generator）とディスクリミネータ（discriminator）の2種類のネットワークで構成されている。

ジェネレータは、入力として潜在空間のランダムベクトルを受け取り、画像を生成して出力する役割をする。
ディスクリミネータは、入力として画像を受け取り、それが本物か、ジェネレータによって生成されたものかを予測して出力する役割をする。

ディスクリミネータの予測結果は、ジェネレータにフィードバックされていくが、ジェネレータは、ディスクリミネータが予測を間違えるような画像を生成するように学習していき、ディスクリミネータは、ジェネレータが生成した画像であることを見抜けるよう学習していく必要がある。
こうして、まさに敵対的に双方を学習によって戦わせることで、本物と見分けのつかない、新しい画像サンプルを作り出すことができるようになっていく。

この敵対的生成ネットワークに、畳み込みニューラルネットワークを用いて、より高度な画像を生成できるようにしたモデルを、DCGAN（Deep Convolutional Generative Adversarial Network）と呼ぶ。
2016年以降は、GANや、DCGANが画像生成モデルにおいて圧倒的な人気を誇っている。

IT is IT.

空想イノベーション

画像生成のための深層生成モデル

変分オートエンコーダ

敵対的生成ネットワーク