import.io – инструмент для извлечения данных со страниц в Интернете

Фрагмент сайта Import.io
Фрагмент сайта import.io

import.io это онлайн-плат­фор­ма, с помо­щью кото­рой мож­но полу­чать дан­ные со стра­ниц сай­тов в Интер­не­те (data scraping), для чего не тре­бу­ет­ся уме­ние про­грам­ми­ро­вать или писать код. Инстру­мент поз­во­ля­ет созда­вать свой соб­ствен­ный API для импор­та дан­ных.

Для извле­че­ния дан­ных с нуж­ной стра­ни­цы сай­та поль­зо­ва­тель вво­дит пря­мую ссыл­ку на эту стра­ни­цу и пока­зы­ва­ет import.io, какие имен­но дан­ные нуж­ны. Систе­ма име­ет алго­рит­мы обу­че­ния, когда по несколь­ким при­ме­рам опре­де­ле­ния дан­ных поль­зо­ва­те­лем import.io соби­ра­ет всю инфор­ма­цию уже само­сто­я­тель­но.

Дан­ные, собран­ные поль­зо­ва­те­лем со стра­ниц сай­та, хра­нят­ся на сер­ве­ре import.io и могут быть загру­же­ны как CSV, Excel, Google Sheets или JSON-фай­лы.

Про­дви­ну­тый поль­зо­ва­тель может сге­не­ри­ро­вать API, что поз­во­ля­ет инте­гри­ро­вать сто­рон­ние дан­ные в свой про­ект, при этом изме­не­ния будут вно­сить­ся авто­ма­ти­че­ски в реаль­ном вре­ме­ни.

У сер­ви­са import.io есть упро­щен­ная вер­сия magic.import.io, когда необ­хо­ди­мо вве­сти толь­ко ссыл­ку. Посмот­реть функ­ци­о­нал реа­ли­за­ции сбо­ра дан­ных мож­но на одном из при­ме­ров.

Примера сбора данных со страницы сайта в таблицу с помощью magic.import.io
При­ме­ра сбо­ра дан­ных со стра­ни­цы сай­та в таб­ли­цу с помо­щью magic.import.io

При­ло­же­ние import.io име­ет боль­ше настро­ек для импор­та дан­ных и пред­став­ля­ет собой сво­е­го рода бра­у­зер.

Фрагмент сайта import.io
Фраг­мент сай­та import.io

Import.io име­ет обшир­ный раз­дел помо­щи с обу­ча­ю­щи­ми видео и доку­мен­та­ми, а так­же форум, где мож­но задать свой вопрос сооб­ще­ству.

Краткий обзор import.io:

Сайт: import.io.