セミブラフしていく

CS、機械学習関係の技術、論文めも

【日記1】GANに思うこと

Webアプリ開発して、論文読んでたら書けることなくなってしまった。。。
最近GANの論文を読むことが多いので自分の考え整理するためにもまとめとく。
正直引用もなくただの所感なのであしからず。

GANでできること

2014年にGANが提案されてからConditionalGAN・DCGANをはじめに様々なGANが出てきて、深層生成モデルの一つとして日々研究がされている。
GANで昨今話題になっていることというのは、画像が他の深層生成モデルと比べてくっきりとした画像を生成することができたり、画像の一部を変えることができるというような技術である。
それを考えると従来の生成モデル、教師なし学習というよりはGANは画像生成、変換に応用、発展しているなぁと感じる。
他に利用されている例としてDataAugmentation、Semi-Supervisedなどがあると思うがいずれにしても画像タスクにおいて応用、提案されているケースが多い。
それを考えるとGANは画像のような高次元なデータに対しての生成が他の手法よりもいいのかなと思える。

GANの欠点

学習が難しいことがあげられる。
自分が考える欠点はGeneratorの設計としての欠点かなと思う。
Generatorはノイズを入力してデータを生成するモデルである。
いわゆるこのモデル自体が確率分布を表現している。
Generatorはこの分布を生成にしか利用できないところが難しい部分だなと思う。
というのもAutoencoderなどは画像を入力して、次元圧縮しながら特徴量をつくりDecoderで生成しているが、GANの場合はGeneraotorにデータを入力できず、ただ生成することが目的である。
以前見た論文ではある画像と似た画像を生成できるようにノイズを変えてノイズを特定していたが、その部分も変えることってできないのかなーと感じる。