セミブラフしていく

CS、機械学習関係の技術、論文めも

論文サーベイメモ1

興味のある論文のAbstractを中心に読んでまとめるメモ。
以後、理解を深めるため論文を精読していく。

Improved Techniques for Training GANs

  • GANを半教師あり学習と画像生成に応用した手法を提案
  • 従来の生成モデルとは違い、本研究は検証データに高い尤度を割り当てられるように学習したり、
    ラベルなしで学習できるようにするモデルを求めるようなものではない
  • 半教師あり学習はMNIST, CIFAR-10, SVHNを利用して高い精度を確認
  • 画像の生成は人間が見分けっれないほど高い質の画像を生成可能

StarGAN: Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation

近年の研究で2つのドメインの画像変換は成功している。
しかし、既存の手法ではドメインの数が2つ以上になった場合、汎化性や大規模なモデル設計に制限がでてくる。
というのも、既存の手法ではドメインペア画像を独立に異なるモデルで学習する必要がでてくるからだ。
そこで本手法は複数のドメインでの画像変換を一つのモデルのみで学習させて行うStarGANを提案。
このStarGANの手法としては2つの画像を入力するとともにドメインの情報(one-hot-vector)を入力して学習させることで単純なモデルでも複数ドメイン間の画像変換が可能。
また、このStarGANをCelebAdatasetとRaFDdatasetを2つを利用して2つのデータセットの別々にあるドメインを使って画像変換できるかを検証し有効性を示した。

Are GANs Created Equal? A Large-Scale Study

GANの研究とはとても豊富にされており、数多くの応用された研究がされている。
しかし、GANの手法を比べて検証するということはとても難しいことが問題の一つとしてある。
そこで様々なGANに対して多数の画像データセットを利用して検証した。
その結果ほとんどのモデルはハイパーパラメータの最適化とrandom restartを利用することで似たようなスコアが得られることがわかった。
これはつまり、計算量の増加やモデルの設計よりもチューニングによって改善する可能性があることを示している。
そこで今までのデータセットを利用した精度検証の限界を克服するために新たなデータセットを提案。

感想

3本目の論文は実際にGANを実装する時にどのようにハイパーパラメータをチューニングすればいいかがわかりそうなのでもっと深く読んでみたい。