Круглый стол на хакатоне Open Data Hackathon «Цена открытости»

В частности, были разработаны приложения, которые позволяют пользователям узнать, какие объекты недвижимости возводятся в их районе, сколько составляет средняя зарплата учителя по регионам, культурный гид по городу и даже геолокационное приложение-будильник, созданное, чтобы пользователи не проспали свою остановку в метро.…

5-6 октября в Санкт-Петербурге состоялся Open Data Hackathon, организованный Open and Future Web Foundation, Теплицей социальных технологий и ИТМО. Это хакатон, на котором молодые программисты-разработчики совместно с гражданскими активистами и просто инициативными молодыми людьми в течение двух дней создавали электронные приложения на основе открытых данных.

В частности, были разработаны приложения, которые позволяют пользователям узнать, какие объекты недвижимости возводятся в их районе, сколько составляет средняя зарплата учителя по регионам, культурный гид по городу и даже геолокационное приложение-будильник, созданное, чтобы пользователи не проспали свою остановку в метро.

Круглый стол, посвященный открытым данным

В конце первого дня проходил круглый стол, на котором обсуждались проблемы развития открытых данных в России. В дискуссии участвовали представители порталов открытых данных Правительства Санкт-Петербурга, Лен. области, Ульяновской области, Москвы и др.

Открытые данные – это общественно значимая информация, которой обладает и которую создает любой государственный орган, орган местного самоуправления. Чтобы общественно значимые материалы можно было легко использовать для создания на их основе полезных для граждан и бизнеса информационных сервисов, их следует публиковать в особом, так называемом машиночитаемом, формате. Этот формат должен обеспечивать автоматическую обработку опубликованных данных, поскольку обрабатывать вручную миллионы файлов ведомственной статистики не представляется возможным. Инициатива по раскрытию данных является фундаментом открытого государственного управления во многих странах мира.

Как представляется, тема открытых данных, с недавних пор став мейнстримом развития Открытого правительства, вобрала в себя слишком много избыточных ожиданий…

Однако, как представляется, тема открытых данных, с недавних пор став мейнстримом развития Открытого правительства, вобрала в себя слишком много избыточных ожиданий. Есть как минимум несколько серьезных проблем и ограничений в этой сфере, о которых важно сказать подробнее.

нужны не данные, им требуются готовые продукты на основе этих данных

Во-первых, на данный момент открытые данные гражданами не востребованы, статистика посещений подобных ресурсов мизерна, и не стоит рассчитывать, что ситуация кардинально изменится в будущем. Людям нужны не данные, им требуются готовые продукты на основе этих данных. Более того, для рядового пользователя, машиночитаемый формат скорее создает барьер, поскольку открыть текстовый файл в формате Word или Excel может каждый, а для работы с форматом CSV или XML нужны специальные знания и программы.

Похожие процессы происходили несколько лет назад при внедрении административных регламентов госуслуг, делавших прозрачным и понятным бюрократический процесс. Тогда тоже были надежды что граждане будут их читать, станут компетентными пользователями и начнут массово контролировать государство. Не случилось. 7 лет назад эту тему начинали продвигать отдельные энтузиасты, сейчас их число выросло до нескольких сотен, но большинство обывателей как не слышали о регламентах, так и не знают о них.

Фрагментарность, неточность, несоответствующие форматы, нерегулярные обновления – типичные жалобы на выложенные государством сведения…

Во-вторых, встает вопрос о том, кто предложит людям данные в готовом к употреблению виде. Отсюда мы выходим на проблему взаимоотношений сторонних разработчиков и органов власти. Ключевой момент в этой сфере – это качество открываемых данных. Ошибки, фрагментарность, неточность, несоответствующие форматы, пробелы и нерегулярные обновления – типичные жалобы на выложенные государством сведения. Следующий пункт – это содержание данных. Наиболее интересные сведения, такие как криминальная статистика, результаты экологических экспертиз, данные на уровне муниципалитетов, районов и отдельных учреждений, до сих пор мало доступны. Наконец, правила взаимоотношений гос.структур и разработчиков также не урегулированы. Не решен вопрос с лицензированием открытых данных, не прописаны регламенты работы с ними, не все ясно с распределением ответственности за их искажение или непредоставление и т.д.

С точки зрения соотношения затрат и выгод КПД не впечатляет.

В-третьих, остаются вопросы о том, что меняют открытые данные с точки зрения взаимоотношений государства и общества. Важно понимать, что открытые данные – это не какая-то новая уникальная информация, это всего лишь унифицированная форма для представления сведений, которые уже есть в ведомствах. И невольно возникает вопрос, стоит ли создавать специальные порталы, тратить немалые средства налогоплательщиков, при том что речь идет о переводе сведений из одного формата в другой. Так, в среднем создание портала в регионе обходится минимум в миллион рублей, а посещаемость составляет 3-5 человек в день (речь идет о Пермском портале открытых данных). С точки зрения соотношения затрат и выгод КПД не впечатляет. Может не стоит плодить сущности, а сосредоточить усилия и оптимизировать работу Росстата, который является ключевым источником государственной информации?

Кто должен платить за «открытие» информации

Наконец, можно просто организовать несколько уровней доступа для заинтересованных лиц к системе межведомственного электронного документооборота, в котором на сегодняшний день хранится вся информация о деятельности органов власти. Опять же, несложным техническим способом можно определить объем и уровни доступной информации, решить вопрос с деперсонализацией сведений, снять необходимость в постоянном обновлении сведений, отдельных специалистах и т.д. То есть заинтересованное лицо, разработчик, получает доступ к данным, выкачивает их в том виде, в котором они содержатся в системе, а затем уже сам переводит их в нужный формат.

И это выглядит логично, когда издержки по переводу информации о деятельности органов власти в машиночитаемый формат с налогоплательщиков перекладываются на самих разработчиков. Кто заинтересован в информации, тот и должен платить за ее обработку. При этом право на доступ к информации не пострадает, поскольку в российском законодательстве прямо указано, что ведомства не обязаны отвечать на запросы требующие правовой оценки актов или проведении иной аналитической работы, непосредственно не связанной с защитой прав направившего запрос пользователя информации.

Сейчас за государственный (наш с вами) счет создаются условия для нового рынка, на который придут мощные бизнес-игроки, вытеснив сегодняшних энтузиастов

Открытые данные – это важно, но есть и более важные вещи, особенно на фоне экономической стагнации в стране. Можно сказать еще жестче, что сейчас за государственный (наш с вами) счет создаются условия для нового рынка, на который придут мощные бизнес-игроки, вытеснив сегодняшних энтузиастов. Большая часть общих сведений будет открыта, но та информация, на основании которой люди принимают решения, станет платной. Условно, каталог городских школ, будет находиться в свободном доступе, а получить аналитику по качеству преподавания в этих школах, вы сможете только за плату.

996927_520275754720465_739385312_nЭто нормально – качественная аналитика стоит денег, и нет ничего плохого в интеллектуальном бизнесе, наоборот, в России его не хватает. Но надо помнить, что стимулируя и принуждая государство сегодня переводить в машиночитаемый формат как можно больше разнообразных сведений, мы как налогоплательщики несем весомые издержки, которые завтра будут приносить выгоду ограниченному кругу лиц. Надо постараться избежать этой мины замедленного действия и соблюсти оптимальный баланс, между интересами разработчиков, чиновников и гражданских активистов.

Соотносить наши информационные потребности и финансовые возможности. В бизнесе есть отличное правило, что для 80% решений, требуется лишь 20% всей собираемой информации. Поэтому сейчас, на этапе формирования сектора и правил игры, важно определить этот критический минимум и понять, за что мы готовы платить, а без каких данных мы можем легко обойтись. А дальше время все расставит на свои места. И у открытых данных есть большие перспективы при тех первопроходцах и энтузиастах, которые их сегодня развивают.