Видеоурок Теплицы: разбираем инструмент для веб-скрейпинга Portia

Веб-скрейпинг сильно упрощает жизнь тем, кто сталкивается с необходимостью собирать и обрабатывать большие массивы данных, полученных из Интернета. Разбираем новый инструмент для скрейпинга от scrapinghub.com Portia.

Веб-скрейпинг сильно упрощает жизнь тем, кто сталкивается с необходимостью собирать и обрабатывать большие массивы данных, полученных из Интернета. Например, это удобно, если вы решили собрать базу данных контактов с какого-либо сайта, выбрать названия и цены товаров или анонсы мероприятий.

Если базы достаточно большие, то на переход по страницам, копирование и вставку можно потратить много времени. Веб-скрейпинг автоматизирует и сильно сокращает этот процесс. Подробно о скрейпинге мы рассказывали в этом видеоуроке, а сегодня хотим рассмотреть новый инструмент для скрейпинга от scrapinghub.com под названием Portia.

Portia относится к программам с открытым исходным кодом, что в переводе означает «распространяется бесплатно». Программа разработана как веб-приложение, то есть вам ничего не нужно скачивать и устанавливать на компьютер. Более того, после регистрации вам автоматически выделяется место на Облаке, и все ваши данные будут дублироваться в безопасном месте.