Deep Learning

Deep Learning

TensorflowでOperatorNotAllowedInGraphError: using a `tf.Tensor` as a Python `bool` is not allowed in Graph execution. Use Eager execution or decorate this function with @tf.function.

tf.data.TFRecordDatasetでmapを使った時に表題のエラー。 mapしたい処理内容を単純化すると以下のような内容。 import tensorflow.experimental.numpy as tnp 2 ** tnp...
Deep Learning

TPUでTensorflow Hubの重みを使おうとしたらUnsuccessful TensorSliceReader constructor: Failed to get matching files on /tmp/tfhub_modules/

ColabのTPUでTensorflow Hubの重みを使おうとしたら表題のエラー hub.KerasLayer(' Unsuccessful TensorSliceReader constructor: Failed to get mat...
Deep Learning

Kaggle Indoor Location & Navigation 15位 解法

KaggleのIndoorコンペにチームで参加し、1170チーム中の15位で上位2%の銀メダルをゲット出来ました。 振り返りも兼ねて解法をまとめようと思います。 チームメイト ペンギンさん、コロンビアさん、つぼさんと4人で参加しました。 誘...
Deep Learning

StyleGAN2-adaでValueError: not enough image data

以下のリポジトリのStyleGAN2-ada でグレースケール画像を学習した重みを使って generate.py を実行した時に表題のエラー generate.py の最後の方にPILを使った画像の保存でつまづいている様子。 PIL.Ima...
Deep Learning

DockerでPyTorchを実行するとRuntimeError: NCCL error unhandled system error, NCCL version 2.8.3

DockerでPyTorchを動かした際に表題のエラー。 ベースイメージはこれ。 FROM nvcr.io/nvidia/pytorch:20.12-py3 エラーログを見てみると ncclSystemError: System call ...
Deep Learning

PyTorchでCUDA error: no kernel image is available for execution on the device

CUDAを11.1に更新した後にPyTorchを実行した際に表題のエラー。 CUDA10だと通常の pip install torch torchvision torchaudio で良いようだが、11.1はバージョン違いによるエラーが起き...
Deep Learning

Tensorflow/KerasでCNNのChannel AttentionとSpatial Attention

CNNに使えるAttentionとして、Convolutional Block Attention Moduleがある。 チャンネル方向のアテンションと空間方向のアテンションを組み合わせることで重み付き特徴マップを作成し、CNNの認識精度を...
Deep Learning

KerasでカスタムAUC、カスタムAccuracyを実装する

10クラスの画像分類をするモデルを構築していた時、精度改善のために拡張して11クラス分類のモデルを構築した。 しかし、評価は元々の10クラスで行いたかったので、custom metricsのクラスを実装した。 例えばカスタムAUCだと以下の...
Deep Learning

GCPのTPUでInvalidArgumentError: Unimplemented: File system scheme ‘[local]’ not implemented

KaggleやColabでTPUを使っていて、SavedModelを保存・復元しようとした時に表題のエラー。 TPUはGoogle Cloud Strage(GCS)のバケットから読み書きするようにデフォルトで設定されており、ローカルから読...
Deep Learning

Tensorflow/KerasでRuntimeError: Unable to create link (name already exists)

tf.kerasでtrainしていた時、ModelCheckpointのh5ファイルの保存でエラー。 RuntimeError: Unable to create link (name already exists) h5pyで躓いているら...