Deep Learning LLMのファインチューニングでEOSが出力されずテキスト生成が終わらない
Llama2のLoRAをしていた時、うまくEOSが出力されず、文章生成がmax_new_tokensの数まで生成されてしまっていた。 解決するのに手間取ったので備忘録。 結論を先に示すとPAD = EOSにしていたのが原因で、EOSもatt...
Deep Learning
Deep Learning
Deep Learning
Deep Learning
Deep Learning
Deep Learning
Deep Learning
Deep Learning
Deep Learning
Deep Learning