IT is IT.

空想イノベーション

機械学習でデータを生成する

f:id:itry:20190225220142j:plain
機械学習においては、何かを認識、識別する以外にも、データを生成する生成タスクにも応用されはじめている。

生成タスクには大きく2種類あり、それぞれについて説明する。

データを元に新しく別の何かを生成する
このタスクは、識別モデルの延長とも言える。
これは、大量の文章を学習したLSTMを用いると、ある文字が最初に与えられさえすれば、その次にどうの文字が来るかを予測し、それを繰り返すことにより新しい文章を生成することができる。
音声においても、WaveNetというモデルが、同等のアプローチをとる仕組みになっている。
ただし、音声データも時系列データであるものの、このWaveNetはリカレントニューラルネットワークではなく、一次元の畳み込みニューラルネットワークを用いて音声を生成している。

スポンサーリンク
 

データそのものを生成したい
元データがどのような分布かを推測し、その分布に基づいて、元データと同じようなデータを生成するモデルとなっている。
データを生成することをサンプリングといい、それによって生成されるモデルを、生成モデルと呼ぶ。
生成モデルも、ディープラーニングと組み合わせることで、これまで以上の成果が得られるようになった。
ディープラーニングを取り入れた生成モデルを、深層生成モデルと呼ぶ。