PGGANのtotal_kimgの意味

 

1024×1024の高解像度画像を生成できるGANとして有名なPGGAN

ソースコードはこれ

tkarras/progressive_growing_of_gans
Progressive Growing of GANs for Improved Quality, Stability, and Variation - tkarras/progressive_growing_of_gans

train.pyのtotal_kimgの意味がピンとこなかったので調べてみた

kimg の k はキロ で 1000

つまり 1 kimg = 1000 images ということ

PGGAN にはエポックやイテレーションという概念が無く、何枚の画像をトレーニングさせるかという考えの様子

デフォルトでは total_kimg = 15000 になっているので、1500 万枚の画像をニューラルネットワークに突っ込んでいる

もちろんこんなに大量の画像を用意しているわけではなくて、確率的勾配降下法でランダムに画像を選び続ける上限数という想像がつく

ということは、トレーニングデータ数が少ないとすぐに過学習を起こして model collapse になりそう

 

参考

What do the following parameters mean? · Issue #3 · deepsound-project/pggan-pytorch
Could you explain what do 'lr_rampup_kimg', 'total_kimg', 'tick_kimg_default' and 'cur_nimg' mean in train.py respectively? And ...

 

コメント

タイトルとURLをコピーしました