Web上の好きな画像データを自動取得する python【icrawlerの使い方】

Python

ディープラーニングの勉強でMNISTやCIFAR10などの元からある画像データではなく、自分でweb上から集めたいときがあります。

10枚程度であればGoogle画像で検索して手作業で保存しても問題ないですが、ディープラーニングに使うような1000枚とかの画像を集めるのは現実的でないため自動取得させましょう。

icrawlerで画像取得

Pythonのライブラリであるicrawlerで画像を取得します。

キーワードを指定し、Google検索でヒットした画像を好きな枚数だけ保存することができます。

Python実装

以下のgetimage.pyファイルを作成します。

from icrawler.builtin import GoogleImageCrawler
import sys
import os

filename = "dog"
word = "犬"
num = 100

if not os.path.isdir(filename):
    os.makedirs(filename)

crawler = GoogleImageCrawler(storage = {"root_dir" : filename})
crawler.crawl(keyword=word, max_num=num)

filenameに保存先フォルダ名を指定し、作成されてなかったらフォルダ作成されます。

wordに検索ワードを指定します。

numには取得する画像枚数を指定します。

ターミナルで実行するとdogというフォルダの中に100枚の犬の画像が保存されています。

実行コマンドです。

python getimage.py

コメント

タイトルとURLをコピーしました