データがなければ作ってしまえばよい、という発想
画像認識を行ううえで、いわゆる一般的なものを認識させるために、実は重大な課題が存在している。
- 同じ物体でも角度が異なると画像としては見え方が異なってみえる
- 同じ物体でも拡大縮小によって画像としては見え方が異なってみえる
- 同じ物体でも光の当たり方(影など)によって画像としては見え方が異なってみえる
これらを正しく同一のものと認識するためには、全ての状態が網羅したデータが存在すればよい。
しかし現実問題としては、あらゆるシチュエーションの画像を網羅的に用意することは非常に困難を極める。
スポンサーリンク
そこで、そういったデータを収集するのではなく、手元にあるデータから擬似的に別のデータを生成する、データ拡張(data augmentation)という手法をとることができる。
データの水増しとも言われるこの方法は、次のようなデータを作り出すことができる。
- 上下左右の位置をずらす
- 上下左右を反転する
- 拡大・縮小をおこなう
- 回転する
- 斜めにゆがめる
- 一部を切り取る
- コンストラストを変える
データ拡張は画像認識を行う学習では、必須の処理といってよい。