Что такое открытые данные и как их визуализировать

Руслан Газиханов и Надежда Дерябина. Фото: Вера Чуракова
Руслан Газиханов и Надежда Дерябина. Фото: Вера Чуракова

30 июля 2016 года в Ульяновске прошел митап Теплицы социальных технологий «Открытые данные и инструменты для их визуализации» с Русланом Газихановым, экспертом-исследователем проектного центра «Инфометр». Он рассказал, что такое открытые данные, для кого они могут быть полезны и как их можно визуализировать.

Что такое открытые данные

Открытые данные – это информация, размещенная в сети Интернет в виде систематизированных данных, организованных в формате для ее автоматической обработки без предварительного изменения человеком в целях неоднократного, свободного и бесплатного использования.

Открытые государственные данные – открытые данные, опубликованные государственными органами, их территориальными органами, органами местного самоуправления или организациями, подведомственными государственным органам, органами местного самоуправления.

Руслан Газиханов. Фото: Надежда Дерябина.
Руслан Газиханов. Фото: Надежда Дерябина.

Для открытых данных характерны два признака: свобода использования и дальнейшего распространения данных и их машиночитаемость. Необходимые пакеты открытых данных вам можете найти на следующих ресурсах:

Руслан Газиханов и Александр Рябушко. Фото: Надежда Дерябина
Руслан Газиханов и Александр Рябушко. Фото: Надежда Дерябина.

Открытые данные могут применяться для создания приложений, инфографики, в сфере data-журналистики и для научных исследований. Преимущества открытых данных в том, что они имеют структурированный формат, регулярно обновляются и являются данными «из первых рук».

Фрагмент презентации Руслана Газиханова.
Фрагмент презентации Руслана Газиханова.

Визуализация данных

На митапе участники ознакомились с самыми популярными инструментами для визуализации данных.

Автоматический генератор инфографики

Плюсы:

  • загрузка данных в CSV (наиболее популярный в России формат открытых данных);
  • автоматическая генерация в зависимости от данных.

Минусы:

  • не русифицирован;
  • для достижения нужного результата данные придется предварительно редактировать.

Автоматические диаграммы

Плюсы:

  • загрузка данных в CSV и TSV, Google Spreadsheets, общие ссылки на Dropbox;
  • русифицирован, доступно переименование;
  • результат можно встроить на сайт;
  • можно выгрузить исходные данные;
  • простой функционал;
  • интерактивность.

Минусы:

  • мало вариантов визуализации;
  • предварительное редактирование документа потенциально необходимо;
  • нет загрузки с диска;
  • при внесении изменений меняется ссылка.

Сервис infogr.am

Плюсы:

  • есть бесплатный функционал;
  • доступна загрузка данных c диска из XLS, XLSX, CSV (также из облачных хранилищ – Google Disk, Dropbox), из ссылки на данные в JSON;
  • можно встроить видео, добавить фото;
  • широкий инструмент для редактирования;
  • можно скачать, поделиться ссылкой, встроить на сайт;
  • доступно редактирование данных.

Минусы:

  • часть функционала в платной версии (карты, расширенная работа с текстом, ссылка с ограничением доступа).

Сервис CANVA

Плюсы:

  • есть бесплатный функционал;
  • широкий инструмент для редактирования;
  • можно скачать, поделиться ссылкой, отправить по e-mail;
  • очень много шаблонов: от инфографики до визиток, открыток, презентаций, плакатов.

Минусы:

  • нет возможности загрузить данные;
  • часть функционала в платной версии;
  • есть шрифты для латиницы.

Сервис Piktochart (похож на сервисы Infogr.am и CANVA)

  • Загрузка с диска или Google Spreadsheet.
  • Бесплатный функционал ограничен (создание карт и вставка видео доступны бесплатно).
Фрагмент презентации Руслана Газиханова.
Интерфейс Tableau Public. Слайд из презентации Руслана Газиханова.

Сервис Tableau Public

Плюсы:

  • бесплатная версия;
  • есть обучающие видео (английский);
  • доступна загрузка данных (Excel 2007 +, CSV, Statistical Files, Web Data Connectors);
  • работа с геоданными;
  • выгрузка: отправить на e-mail, поделиться Twitter, Facebook, LinkedIn, Google+;
  • сохранять на аккаунт в Tableau.

Минусы:

  • может потребоваться предварительная подготовка файла.

Скачайте презентацию спикера Руслана Газиханова в формате PDF