Революция открытых данных: ожидания и результаты

Data Revolution: Digital Misunderstandings. Фото: SEI — Stockholm Environment Institute.
Data Revolution: Digital Misunderstandings. Фото: SEI — Stockholm Environment Institute.

К чему нас при­ве­ло появ­ле­ние откры­тых дан­ных? The Economist ана­ли­зи­ру­ет «рево­лю­цию откры­тых дан­ных»: успе­хи, про­бле­мы и их воз­мож­ные реше­ния.

Шесть лет назад Аме­ри­ка ста­ла стра­ной, сде­лав­шей все пра­ви­тель­ствен­ные дан­ные откры­ты­ми, не счи­тая пер­со­наль­ной инфор­ма­ции и дан­ных, отно­ся­щих­ся к наци­о­наль­ной без­опас­но­сти. С тех пор более 200 000 набо­ров дан­ных были опуб­ли­ко­ва­ны на офи­ци­аль­ном сай­те data.gov.

Более 70 дру­гих стран так­же сде­ла­ли свои дан­ные откры­ты­ми. Соглас­но Open Knowledge, более 1 мил­ли­о­на набо­ров дан­ных были опуб­ли­ко­ва­ны на раз­лич­ных пор­та­лах.

В резуль­та­те мы уви­де­ли появ­ле­ние боль­шо­го коли­че­ства транс­порт­ных рас­пи­са­ний, дан­ных о пре­ступ­ле­ни­ях, загряз­не­нии воз­ду­ха и нало­гах. Но, несмот­ря на то, что все это, без­услов­но, помог­ло сде­лать жизнь людей луч­ше, не ясно, спо­соб­но ли это при­ве­сти к зна­чи­тель­ной транс­фор­ма­ции, – для того что­бы она про­изо­шла, пер­во­на­чаль­ный энту­зи­азм, с кото­рым были опуб­ли­ко­ва­ны дан­ные, дол­жен пре­вра­тить­ся в здо­ро­вый праг­ма­тизм.

Успехи открытых данных

Во мно­гих горо­дах поль­зо­ва­те­ли смарт­фо­нов могут узнать, когда при­дет их авто­бус, на осно­ва­нии ауди­та боль­ниц решить, куда обра­тить­ся за меди­цин­ской помо­щью, а GPS, аме­ри­кан­ская воен­ная систе­ма нави­га­ции, теперь может быть най­де­на где угод­но – от при­ло­же­ний для зна­комств до мик­ро­чи­пов в ошей­ни­ках собак.

Мно­гие горо­да исполь­зу­ют отче­ты жите­лей о ямах на доро­гах или нера­бо­та­ю­щих фона­рях. Откры­тые дан­ные помо­га­ют и в борь­бе с кор­руп­ци­ей. Так, напри­мер, в 2014 году в Мек­си­ке бла­го­да­ря откры­тым дан­ным было обна­ру­же­но более 1 400 рабо­та­ю­щих учи­те­лей, родив­ших­ся в один и тот же день в 1912 году, что поз­во­ли­ло убрать этих «при­зра­ков» из пла­теж­ной систе­мы.

Это все без­услов­ные успе­хи откры­тых дан­ных. Но, учи­ты­вая огром­ное коли­че­ство име­ю­щих­ся набо­ров дан­ных, воз­ни­ка­ет вопрос, поче­му с их помо­щью мы не достиг­ли боль­ше­го.

Проблемы открытых данных

По мне­нию The Economist, на этот вопрос есть четы­ре отве­та.

Во-пер­вых, откры­тые дан­ные часто бес­по­лез­ны. Во-вто­рых, про­грам­ми­стам и пред­при­ни­ма­те­лям, кото­рые мог­ли бы сде­лать из дан­ных полез­ные про­дук­ты, быва­ет очень слож­но в них разо­брать­ся. В-тре­тьих, спе­ци­а­ли­стов, кото­рые могут рабо­тать с откры­ты­ми дан­ны­ми, недо­ста­точ­но. Нако­нец, в-чет­вер­тых, вопро­сы без­опас­но­сти лич­ной инфор­ма­ции по-преж­не­му не реше­ны.

Воз­мож­но, боль­ше поло­ви­ны всех откры­тых дан­ных вооб­ще не име­ют прак­ти­че­ской поль­зы. Напри­мер, один из набо­ров дан­ных в Аме­ри­ке вклю­ча­ет в себя послед­ние сло­ва людей, при­го­во­рен­ных к смерт­ной каз­ни в Теха­се. Дру­гой части дан­ных не хва­та­ет важ­ных мета­дан­ных – опи­са­тель­ных тегов, без кото­рых сырая инфор­ма­ция может не иметь зна­че­ния. В неко­то­рых стра­нах откры­тые дан­ные настоль­ко сфаб­ри­ко­ван­ные или нека­че­ствен­ные, что мно­гие орга­ни­за­ции пред­по­чи­та­ют соби­рать дан­ные само­сто­я­тель­но.

Поиск откры­тых дан­ных так­же часто ста­но­вит­ся слож­ной зада­чей, а неко­то­рые набо­ры дан­ных на госу­дар­ствен­ных пор­та­лах явля­ют­ся уста­рев­ши­ми.

Нель­зя не отме­тить и недо­ста­ток зна­ний и навы­ков по рабо­те с откры­ты­ми дан­ны­ми сре­ди долж­ност­ных лиц, акти­ви­стов и жур­на­ли­стов. При этом про­бле­ма не в том, что толь­ко немно­гие люди обла­да­ют спе­ци­аль­ны­ми навы­ка­ми, мно­гие испы­ты­ва­ют слож­но­сти даже с тем, что­бы интер­пре­ти­ро­вать циф­ры. Гэвин Старкс из Open Data Institute при­во­дит в при­мер чле­нов бри­тан­ско­го пар­ла­мен­та, боль­шин­ство из кото­рых не смог­ли решить про­стой мате­ма­ти­че­ский тест с дву­мя слу­чай­ны­ми вели­чи­на­ми.

Тем не менее самая слож­ная про­бле­ма откры­тых дан­ных в насто­я­щий момент – это их при­ват­ность. Пра­ви­тель­ства, откры­ва­ю­щие такую лич­ную инфор­ма­цию, как нало­го­вые, меди­цин­ские и обра­зо­ва­тель­ные дан­ные, «ходят по мин­но­му полю». Несмот­ря на то, что такая инфор­ма­ция явля­ет­ся самой цен­ной и спо­соб­на, напри­мер, зна­чи­тель­но улуч­шить меди­ци­ну, пуб­лич­ные скан­да­лы, свя­зан­ные с рас­кры­ти­ем лич­ных дан­ных, рабо­та­ют про­тив них.

В насто­я­щее вре­мя акти­ви­сты откры­тых дан­ных вме­сте с чинов­ни­ка­ми и пред­при­ни­ма­те­ля­ми рабо­та­ют над реше­ни­ем этих про­блем. Пра­ви­тель­ства начи­на­ют выпус­кать дан­ные в маши­но­чи­та­е­мом фор­ма­те. Про­во­дит­ся все боль­ше хака­то­нов по откры­тым дан­ным, при­вле­ка­ю­щих энту­зи­а­стов и инве­сто­ров, кото­рые могут пре­вра­тить идеи в успеш­ные про­ек­ты. Неком­мер­че­ские орга­ни­за­ции учат людей тому, как рабо­тать с дан­ны­ми, – пуб­ли­ку­ют руко­вод­ства и орга­ни­зу­ют обу­че­ние.

Про­бле­ма при­ват­но­сти слож­нее, но и здесь воз­мож­ны раз­лич­ные реше­ния. Без­услов­но, слож­но ска­зать, куда нас при­ве­дет рево­лю­ция откры­тых дан­ных, но дан­ные GPS ста­ли откры­ты в 1983 году, и никто тогда не думал, что одна­жды эти дан­ные води­те­лям будут помо­гать нахо­дить доро­гу, оди­но­ким людям – любовь, а хозя­е­вам – сво­их поте­ряв­ших­ся собак.