cocoinit23

Gradioで1つのTextboxから複数のChatbotに同じメッセージを送る

Gradioでチャットボットを実装して色々なLLMやプロンプトで遊んでいた時、同じテキストを入力した場合にLLMの種類やプロンプト設計で結果がどのように変わるのかを比較したくなった。 1つのTextboxから複数のChatbotに同じメッセ...

2024.05.07 2024.05.08

Python

SDK Managerからイメージを書き込んでJetson AGX Orinの初期化をしようとしていたら表題のエラー。 Flashの手順は以下のページを参考にしていた。 SDK上ではデバイスが認識されているのだが、いざFlashを実行すると...

2024.03.12

Linux

Streamlitで作ったwebアプリにGoogle Analyticsのタグ（gtag.js）を埋め込みたかったが手こずった。 st.components.v1.htmlやst.markdownでhtmlを書き込むことが可能だが、<bod...

2024.01.10

Python

Deep Learning

Llama2のLoRAをしていた時、うまくEOSが出力されず、文章生成がmax_new_tokensの数まで生成されてしまっていた。解決するのに手間取ったので備忘録。結論を先に示すとPAD = EOSにしていたのが原因で、EOSもatt...

2023.11.14 2024.01.18

Deep Learning

LLMのファインチューニングを行う際、QLoRAやPEFTで行われている記事が多いが、これらの効率化技術を使わなかった時の性能を確認してみたくなった。また、大規模データで学習済みのモデルは入力層に近いほどデータの抽象的な特徴を学習している...

2023.10.02 2024.03.18

Deep Learning

LLMの学習データを用意していた際、人名などの個人情報をマスキングしたくなった。調べてみると、日本語の自然言語処理ライブラリであるGiNZAで固有表現を抽出できるみたい。 v5からTransformersモデルを採用しており、解析精度が向...

2023.09.27 2024.01.18

Python

Deep Learning

kerasのmodel.summary()と似たようなことをpytorchのモデルで行ってくれるライブラリとして、torchinfoがある。 llama2がどんな構造でパラメータ数なのか気になったのでtorchinfoを使ってみた所、表題の...

2023.09.21

Deep Learning

再起動せずにSSD/HDDを交換したい場面があったので、Ubuntuでのホットスワップの手順をまとめた。マザーボードやBIOSがホットスワップに対応していること前提。以下、交換したいストレージは/dev/sdbでアンマウント済、ルートユ...

2023.08.29

Linux

文献管理ツールのEndNoteにarXivの論文を取り込むのに手こずったので備忘録。 arXivの論文ページ右側のDownloadからNASA ADSをクリック。左側のExport Citationを選択し、Export FormatをE...

2023.07.24 2024.01.18

その他

深さ優先探索では、行きがけ（preorder）、帰りがけ（postorder）、通りがけ（inorder）を使い分けることがあるが、こんがらってしまう。理解しやすいよう2分木で簡単な実装をしてみた。以下、当該ノード、左部分技、右部分技のこ...

2023.07.14

LeetCode