Революция открытых данных: ожидания и результаты

Data Revolution: Digital Misunderstandings. Фото: SEI — Stockholm Environment Institute.
Data Revolution: Digital Misunderstandings. Фото: SEI — Stockholm Environment Institute.

К чему нас привело появление открытых данных? The Economist анализирует «революцию открытых данных»: успехи, проблемы и их возможные решения.

Шесть лет назад Америка стала страной, сделавшей все правительственные данные открытыми, не считая персональной информации и данных, относящихся к национальной безопасности. С тех пор более 200 000 наборов данных были опубликованы на официальном сайте data.gov.

Более 70 других стран также сделали свои данные открытыми. Согласно Open Knowledge, более 1 миллиона наборов данных были опубликованы на различных порталах.

В результате мы увидели появление большого количества транспортных расписаний, данных о преступлениях, загрязнении воздуха и налогах. Но, несмотря на то, что все это, безусловно, помогло сделать жизнь людей лучше, не ясно, способно ли это привести к значительной трансформации, – для того чтобы она произошла, первоначальный энтузиазм, с которым были опубликованы данные, должен превратиться в здоровый прагматизм.

Успехи открытых данных

Во многих городах пользователи смартфонов могут узнать, когда придет их автобус, на основании аудита больниц решить, куда обратиться за медицинской помощью, а GPS, американская военная система навигации, теперь может быть найдена где угодно – от приложений для знакомств до микрочипов в ошейниках собак.

Многие города используют отчеты жителей о ямах на дорогах или неработающих фонарях. Открытые данные помогают и в борьбе с коррупцией. Так, например, в 2014 году в Мексике благодаря открытым данным было обнаружено более 1 400 работающих учителей, родившихся в один и тот же день в 1912 году, что позволило убрать этих «призраков» из платежной системы.

Это все безусловные успехи открытых данных. Но, учитывая огромное количество имеющихся наборов данных, возникает вопрос, почему с их помощью мы не достигли большего.

Проблемы открытых данных

По мнению The Economist, на этот вопрос есть четыре ответа.

Во-первых, открытые данные часто бесполезны. Во-вторых, программистам и предпринимателям, которые могли бы сделать из данных полезные продукты, бывает очень сложно в них разобраться. В-третьих, специалистов, которые могут работать с открытыми данными, недостаточно. Наконец, в-четвертых, вопросы безопасности личной информации по-прежнему не решены.

Возможно, больше половины всех открытых данных вообще не имеют практической пользы. Например, один из наборов данных в Америке включает в себя последние слова людей, приговоренных к смертной казни в Техасе. Другой части данных не хватает важных метаданных – описательных тегов, без которых сырая информация может не иметь значения. В некоторых странах открытые данные настолько сфабрикованные или некачественные, что многие организации предпочитают собирать данные самостоятельно.

Поиск открытых данных также часто становится сложной задачей, а некоторые наборы данных на государственных порталах являются устаревшими.

Нельзя не отметить и недостаток знаний и навыков по работе с открытыми данными среди должностных лиц, активистов и журналистов. При этом проблема не в том, что только немногие люди обладают специальными навыками, многие испытывают сложности даже с тем, чтобы интерпретировать цифры. Гэвин Старкс из Open Data Institute приводит в пример членов британского парламента, большинство из которых не смогли решить простой математический тест с двумя случайными величинами.

Тем не менее самая сложная проблема открытых данных в настоящий момент – это их приватность. Правительства, открывающие такую личную информацию, как налоговые, медицинские и образовательные данные, «ходят по минному полю». Несмотря на то, что такая информация является самой ценной и способна, например, значительно улучшить медицину, публичные скандалы, связанные с раскрытием личных данных, работают против них.

В настоящее время активисты открытых данных вместе с чиновниками и предпринимателями работают над решением этих проблем. Правительства начинают выпускать данные в машиночитаемом формате. Проводится все больше хакатонов по открытым данным, привлекающих энтузиастов и инвесторов, которые могут превратить идеи в успешные проекты. Некоммерческие организации учат людей тому, как работать с данными, – публикуют руководства и организуют обучение.

Проблема приватности сложнее, но и здесь возможны различные решения. Безусловно, сложно сказать, куда нас приведет революция открытых данных, но данные GPS стали открыты в 1983 году, и никто тогда не думал, что однажды эти данные водителям будут помогать находить дорогу, одиноким людям – любовь, а хозяевам – своих потерявшихся собак.