1024×1024の高解像度画像を生成できるGANとして有名なPGGAN
ソースコードはこれ
GitHub - tkarras/progressive_growing_of_gans: Progressive Growing of GANs for Improved Quality, Stability, and Variation
Progressive Growing of GANs for Improved Quality, Stability, and Variation - tkarras/progressive_growing_of_gans
train.pyのtotal_kimgの意味がピンとこなかったので調べてみた
kimg の k はキロ で 1000
つまり 1 kimg = 1000 images ということ
PGGAN にはエポックやイテレーションという概念が無く、何枚の画像をトレーニングさせるかという考えの様子
デフォルトでは total_kimg = 15000 になっているので、1500 万枚の画像をニューラルネットワークに突っ込んでいる
もちろんこんなに大量の画像を用意しているわけではなくて、確率的勾配降下法でランダムに画像を選び続ける上限数という想像がつく
ということは、トレーニングデータ数が少ないとすぐに過学習を起こして model collapse になりそう
参考
What do the following parameters mean? · Issue #3 · deepsound-project/pggan-pytorch
Could you explain what do 'lr_rampup_kimg', 'total_kimg', 'tick_kimg_default' and 'cur_nimg' mean in train.py respective...
コメント