ModuleNotFoundError: No module named ‘tensorflow_datasets’
が出るので、初めに
!pip install tensorflow-datasets
しておく。
import tensorflow_datasets as tfds
import matplotlib.pyplot as plt
import numpy as np
で、通常は
ds_train, ds_info = tfds.load('celeb_a', split='test', shuffle_files=False, with_info=True)
により、GoogleDriveからceleb_aのデータセットを「/root/tensorflow_datasets/celeb_a.zip」にダウンロードしてきてくれるが、アクセスしている人が多いからなのか、「NonMatchingChecksumError」でエラーになる。
なので、gdownモジュールで手動でダウンロードしてくる。
!pip install gdown
import gdown
url = 'https://drive.google.com/uc?id=1tCj_CKUgjtThk1fiL0wP0WiuYxk4dvjT'
import os
tfds_rootdir = '/root/' # for Google Colab
#tfds_rootdir = '~/' # for Linux
file_path = os.path.join(tfds_rootdir, 'tensorflow_datasets/celeb_a.zip')
file_dir = file_path.replace('.zip','')
gdown.download(url, file_path, quiet=False)
ダウンロードできたら、unzipして、ロード → 表示すればよい。
!unzip $file_path -d $file_dir
ds_train, ds_info = tfds.load('celeb_a', split='test', shuffle_files=False, with_info=True)
fig = tfds.show_examples(ds_train, ds_info)