Введение
Научимся парсить изображения из гугла по запросу с помощью python.
Программа будет работать следующим образом: пользователь вводит запрос, количество изображений, которые нужно спарсить и путь до папки, в которую нужно сохранить все изображения. После чего, выбранное количество изображений скачается в выбранную папку.
Установка модуля icrawler
Для парсинга изображений мы будем использовать модуль под названием icrawler. Установим его:
pip install icrawler
Написание кода
Для начала импортируем GoogleImageCrawler из icrawler:
from icrawler.builtin import GoogleImageCrawler
Создадим три переменные, в которые пользователь будет вводить данные:
name = input('По какому запросу парсить изображения?\n')
quantity = int(input('Сколько нужно спарсить изображений?\n'))
path = input('Куда сохранить изображения?\n')
Создадим объект класса GoogleImageCrawler, так же добавим параметр storage, который приравняем к расположению папки итогового хранения изображений:
google_crawler = GoogleImageCrawler(storage={'root_dir': path})
Осталось только скачать изображения, для этого вызовем метод crawl():
google_crawler.crawl(keyword=name, max_num=quantity)
keyword — запрос в google изображениях
max_num — количество скачиваемых изображений
Заключение
В данной статье мы написали простую программу для парсинга изображений на python.
Надеюсь Вам понравилась статья, удачи! 🙂