Что такое открытые данные и как их визуализировать

Руслан Газиханов и Надежда Дерябина. Фото: Вера Чуракова
Руслан Газиханов и Надежда Дерябина. Фото: Вера Чуракова

30 июля 2016 года в Улья­нов­ске про­шел митап Теп­ли­цы соци­аль­ных тех­но­ло­гий «Откры­тые дан­ные и инстру­мен­ты для их визу­а­ли­за­ции» с Рус­ла­ном Гази­ха­но­вым, экс­пер­том-иссле­до­ва­те­лем про­ект­но­го цен­тра «Инфо­метр». Он рас­ска­зал, что такое откры­тые дан­ные, для кого они могут быть полез­ны и как их мож­но визу­а­ли­зи­ро­вать.

Что такое открытые данные

Откры­тые дан­ные – это инфор­ма­ция, раз­ме­щен­ная в сети Интер­нет в виде систе­ма­ти­зи­ро­ван­ных дан­ных, орга­ни­зо­ван­ных в фор­ма­те для ее авто­ма­ти­че­ской обра­бот­ки без пред­ва­ри­тель­но­го изме­не­ния чело­ве­ком в целях неод­но­крат­но­го, сво­бод­но­го и бес­плат­но­го исполь­зо­ва­ния.

Откры­тые госу­дар­ствен­ные дан­ные – откры­тые дан­ные, опуб­ли­ко­ван­ные госу­дар­ствен­ны­ми орга­на­ми, их тер­ри­то­ри­аль­ны­ми орга­на­ми, орга­на­ми мест­но­го само­управ­ле­ния или орга­ни­за­ци­я­ми, под­ве­дом­ствен­ны­ми госу­дар­ствен­ным орга­нам, орга­на­ми мест­но­го само­управ­ле­ния.

Руслан Газиханов. Фото: Надежда Дерябина.
Рус­лан Гази­ха­нов. Фото: Надеж­да Деря­би­на.

Для откры­тых дан­ных харак­тер­ны два при­зна­ка: сво­бо­да исполь­зо­ва­ния и даль­ней­ше­го рас­про­стра­не­ния дан­ных и их маши­но­чи­та­е­мость. Необ­хо­ди­мые паке­ты откры­тых дан­ных вам може­те най­ти на сле­ду­ю­щих ресур­сах:

Руслан Газиханов и Александр Рябушко. Фото: Надежда Дерябина
Рус­лан Гази­ха­нов и Алек­сандр Рябуш­ко. Фото: Надеж­да Деря­би­на.

Откры­тые дан­ные могут при­ме­нять­ся для созда­ния при­ло­же­ний, инфо­гра­фи­ки, в сфе­ре data-жур­на­ли­сти­ки и для науч­ных иссле­до­ва­ний. Пре­иму­ще­ства откры­тых дан­ных в том, что они име­ют струк­ту­ри­ро­ван­ный фор­мат, регу­ляр­но обнов­ля­ют­ся и явля­ют­ся дан­ны­ми «из пер­вых рук».

Фрагмент презентации Руслана Газиханова.
Фраг­мент пре­зен­та­ции Рус­ла­на Гази­ха­но­ва.

Визуализация данных

На мита­пе участ­ни­ки озна­ко­ми­лись с самы­ми попу­ляр­ны­ми инстру­мен­та­ми для визу­а­ли­за­ции дан­ных.

Автоматический генератор инфографики

Плю­сы:

  • загруз­ка дан­ных в CSV (наи­бо­лее попу­ляр­ный в Рос­сии фор­мат откры­тых дан­ных);
  • авто­ма­ти­че­ская гене­ра­ция в зави­си­мо­сти от дан­ных.

Мину­сы:

  • не руси­фи­ци­ро­ван;
  • для дости­же­ния нуж­но­го резуль­та­та дан­ные при­дет­ся пред­ва­ри­тель­но редак­ти­ро­вать.

Автоматические диаграммы

Плю­сы:

  • загруз­ка дан­ных в CSV и TSV, Google Spreadsheets, общие ссыл­ки на Dropbox;
  • руси­фи­ци­ро­ван, доступ­но пере­име­но­ва­ние;
  • резуль­тат мож­но встро­ить на сайт;
  • мож­но выгру­зить исход­ные дан­ные;
  • про­стой функ­ци­о­нал;
  • интер­ак­тив­ность.

Мину­сы:

  • мало вари­ан­тов визу­а­ли­за­ции;
  • пред­ва­ри­тель­ное редак­ти­ро­ва­ние доку­мен­та потен­ци­аль­но необ­хо­ди­мо;
  • нет загруз­ки с дис­ка;
  • при вне­се­нии изме­не­ний меня­ет­ся ссыл­ка.

Сервис infogr.am

Плю­сы:

  • есть бес­плат­ный функ­ци­о­нал;
  • доступ­на загруз­ка дан­ных c дис­ка из XLS, XLSX, CSV (так­же из облач­ных хра­ни­лищ – Google Disk, Dropbox), из ссыл­ки на дан­ные в JSON;
  • мож­но встро­ить видео, доба­вить фото;
  • широ­кий инстру­мент для редак­ти­ро­ва­ния;
  • мож­но ска­чать, поде­лить­ся ссыл­кой, встро­ить на сайт;
  • доступ­но редак­ти­ро­ва­ние дан­ных.

Мину­сы:

  • часть функ­ци­о­на­ла в плат­ной вер­сии (кар­ты, рас­ши­рен­ная рабо­та с тек­стом, ссыл­ка с огра­ни­че­ни­ем досту­па).

Сервис CANVA

Плю­сы:

  • есть бес­плат­ный функ­ци­о­нал;
  • широ­кий инстру­мент для редак­ти­ро­ва­ния;
  • мож­но ска­чать, поде­лить­ся ссыл­кой, отпра­вить по e-mail;
  • очень мно­го шаб­ло­нов: от инфо­гра­фи­ки до визи­ток, откры­ток, пре­зен­та­ций, пла­ка­тов.

Мину­сы:

  • нет воз­мож­но­сти загру­зить дан­ные;
  • часть функ­ци­о­на­ла в плат­ной вер­сии;
  • есть шриф­ты для лати­ни­цы.

Сервис Piktochart (похож на сервисы Infogr.am и CANVA)

  • Загруз­ка с дис­ка или Google Spreadsheet.
  • Бес­плат­ный функ­ци­о­нал огра­ни­чен (созда­ние карт и встав­ка видео доступ­ны бес­плат­но).
Фрагмент презентации Руслана Газиханова.
Интер­фейс Tableau Public. Слайд из пре­зен­та­ции Рус­ла­на Гази­ха­но­ва.

Сервис Tableau Public

Плю­сы:

  • бес­плат­ная вер­сия;
  • есть обу­ча­ю­щие видео (англий­ский);
  • доступ­на загруз­ка дан­ных (Excel 2007 +, CSV, Statistical Files, Web Data Connectors);
  • рабо­та с гео­дан­ны­ми;
  • выгруз­ка: отпра­вить на e-mail, поде­лить­ся Twitter, Facebook, LinkedIn, Google+;
  • сохра­нять на акка­унт в Tableau.

Мину­сы:

  • может потре­бо­вать­ся пред­ва­ри­тель­ная под­го­тов­ка фай­ла.

Ска­чай­те пре­зен­та­цию спи­ке­ра Рус­ла­на Гази­ха­но­ва в фор­ма­те PDF