Больше, чем цифра: как готовились самые известные дата-расследования в России

Иван Голунов на конференции «Сетевой сентябрь» собрал дата-журналистов и спросил, как они готовили свои расследования Изображение: данные из расследования «Новой газеты» про судебный «копипаст»

В России довольно много открытых данных, которые помогают журналистам-расследователям в работе. Так считает Иван Голунов, журналист интернет-издания «Медуза». На конференции «Сетевой сентябрь» он собрал дата-журналистов из разных проектов, чтобы узнать, как они проводили свои расследования и согласны ли с тем, что многие данные есть в открытом доступе, достаточно ими воспользоваться.

Андрей Заякин

Сооснователь вольного сетевого сообщества «Диссернет», физик, редактор дата-отдела «Новой газеты».

– Начну с успешных историй. Мы опубликовали в 2020 году расследование про швейцарских прокуроров. Оно целиком было основано на анализе швейцарских судебных актов. Это не было дата-расследование в чистом виде, мы исследовали конкретный набор судебных историй. Но это расследование показательно тем, что оно оказалось напрямую действующим инструментом в том, что касается последствий для его фигурантов.

Был в Швейцарии такой прокурор Михаэль Лаубер, который вел себя странно, и его помощник, который вел себя еще более странно. Мы перевели наше расследование на английский язык, это вызвало бурление в политических кругах. В итоге персонаж нашего расследования уволен. Я прошелся по всем нашим кейсам за последние полтора года. И, пожалуй, это единственный успешный случай. Но эта история сработала, потому что в Швейцарии, помимо журналистов, есть другие работающие институты гражданского общества. 

Можно привести еще один пример. Мы с Алексеем Смагиным (корреспондент дата-отдела «Новой газеты». – Прим.ред.) анализировали то, как вузы заставляют сотрудников публиковать все больше и больше научных статей при полном отсутствии контроля качества. В результате развивается рынок фальшивых журнальных публикаций. В данном случае я не могу сказать, что расследование уже на что-то повлияло. Но сотрудники Министерства образования начали пересмотры шкалы, по которой оценивают труд научных сотрудников.

Изображение: данные расследования «Новой газеты»
Изображение: данные расследования «Новой газеты».

Расследование возымело действие, и механизмы закрутились. Сейчас мы имеем пересмотренную шкалу, по которой за публикацию в каком-то непонятном журнале начисляют не один балл, а одну десятую балла. Почему это сработало? Потому что существует сложная игра на этом поле, в которой участвуют Министерство науки и высшего образования, Российская академия наук, университеты и журнальные издания. Когда расследование попадает в нерв такого противоречия, статья в медиа может привести к каким-то изменениям. 

Еще один материал, который я считаю самым серьезным нашим расследованием, – история про судебный «копипаст», когда одно судебное решение практически полностью совпадает с другим. Я не могу в данном случае приписать успех исключительно нашему расследованию. У меня есть инсайдерская информация, что наш роман прочитали, но я пока не ставлю большой знак восклицания. Появился ряд судебных историй, когда основанием для пересмотра судебных данных явился копипаст. При этом речь не идет о копипастерских решениях, которые мы выявили в этом расследовании. Но я рад, что такая практика, когда судья с флешки переписывает приговор, хоть как-нибудь будет остановлена и заторможена. Если мы сможем задействовать борьбу кланов в судейской среде, в выигрыше будет гражданское общество.

Изображение: данные из расследования про судебный «копипаст»
Изображение: данные из расследования про судебный «копипаст».

Но это истории успеха. Есть другой пример. Я исследовал данные по выборам в Мосгордуму 2019 года. Статистика показала, что победа кандидатов от партии власти была достигнута практически за счет небольшого перевеса, связанного с голосованием надомников. То есть тех, кому урну для голосования привозят члены избирательной комиссии на дом. Методы, описанные в этом исследовании, были использованы во время голосования по поправкам в Конституцию. Где как раз за счет надомников набивались какие-то немыслимые проценты. Почему не получилось успеха? Потому что в истории не было борьбы интересов и борьбы кланов, в которую расследование могло попасть. 

Еще про обратный эффект. Команда «Диссернета» очень много занималась таким феноменом, как «лжекниги». Суть в следующем – автор задним числом издает книгу. А потом, когда его начинают лишать ученой степени, приносит ее в Высшую аттестационную комиссию (ВАК) и начинает говорить: «Смотрите, это я не списал, у меня списали, книга моя была издана 20 лет назад». Про это я писал в «Новой газете» несколько раз. Однако результат меня удивил, я пока в недоумении, что именно сыграло роль. Но итогом стал отказ ВАК в принципе рассматривать сведения о недостоверности выходных данных книг. По сути это полное безумие. 

Немного выводов. При отсутствии у нас конкурентной политической системы и независимого суда ваша публикация может на что-то повлиять, если вы попадаете в нерв каких-то враждующих группировок. Если ваша публикация ссорит одних влиятельных людей с другими. Две группы, которые действуют в личных интересах, а не в интересах общества. Тогда что-то может измениться. И какая тема, неважно. 

К успеху также может привести технология, которую можно описать словом «назойливость». Я не люблю слово «давление», потому что давление на органы власти возможно только в демократической стране. Но у нас есть чиновники, которые очень не любят, когда их теребят. Создание бюрократического давления влияет на людей, которых вы изучаете и расследуете, может сыграть роль. Потому что довольно часто чиновнику проще принять решение по справедливости, чем бороться с потоком свалившихся на него жалоб и писем.

Дада Линделл

Дата-журналистка, победительница конкурса Data Journalism Awards (2019).

– Нам как гражданам приходится сталкиваться не только с людьми, которые стоят на руководящих должностях. Но и с какими-то более мелкими чиновниками, которые реализуют или не реализуют решения, принятые на высшем уровне. Расскажу про наше исследование смертности от ВИЧ. Я слежу за тем, что происходит после выхода публикации. Ее появление привело к тому, что чиновники на местах стали по косвенным признакам работать лучше, увеличилось обеспечение лекарствами людей, которые страдают от этого заболевания. 

В России любой человек может направить запрос в государственный орган, попросить данные о его работе и в течение 30 дней получить ответ. 

Дада Линделл

Единственная привилегия, которая есть у журналистов, – ответ на запрос должен прийти в течение 7 дней. Хотя, конечно, на практике не всегда госорганы успевают отвечать в этот срок. Росстат – орган, который собирает данные о смертности россиян на основании справок о смерти. Собранные данные публикуются по-разному, зависит от причины смерти. О некоторых причинах смерти Росстат публикует оперативные данные, то есть раз в месяц. Например, увидеть данные о смертности от онкологии или туберкулеза можно на ежемесячной основе. А о каких-то конкретных видах рака или других инфекциях, в том числе ВИЧ, можно получить данные раз в два года в «Демографическом ежегоднике». 

Изображение: исследование РБК
Изображение: исследование РБК

И когда я решила узнать, что происходит со смертностью от ВИЧ в России в марте 2019 года, то понимала, что только в декабре будут опубликованы данные за 2017 год. Мне, конечно, хотелось получить их быстрее. Такие данные не должны быть закрытыми. В результате я понимала, что эти данные собираются, они есть в наличии, но когда я их спрашиваю, Росстат предоставляет мне только данные за 2017 год. Тогда я обратилась в каждое региональное отделение Росстата в каждом регионе России, написала им типовые запросы. И получила ответы на эти запросы. Не сразу, но ответили все регионы. 

После этого я смогла данные агрегировать, сравнить с другими годами и выяснить, в каких регионах смертность увеличилась. Прямой связи между количеством носителей в регионе и количеством умершим нет. Можно быть носителем, принимать терапию и не умирать от СПИДа. Если растет смертность, это означает, что либо в этом регионе нехватка терапии, перебои с лекарствами, либо люди отказываются от терапии, и медицинские работники никак не могут на них повлиять. Именно поэтому я считаю, что публикация таких данных и ее мониторинг – это очень важно. 

В результате мы сделали публикацию, в которой показали, что смертность растет, и впервые опубликовали данные о смертности по регионам. Материал стал одним из самых читаемых в 2019 году. Это серьезный показатель. Он означает, что людей интересует эта проблема. Была и реакция на местах. Проводились довольно внезапные совещания, на которых говорилось, что нужно увеличивать обеспечение лекарствами людей. 

Изображение: исследование РБК
Изображение: исследование РБК.

Был момент, когда СПИД начали включать в оперативные данные, но потом перестали. В январе 2020 года данные снова не публиковали. Дальше было еще хуже. Случилась пандемия, и вообще перестали публиковать оперативные данные о смертности, кроме как от коронавируса. Это катастрофа. Сейчас мы находимся в моменте, когда все стало очень плохо. Я не считаю Росстат чудовищем, который от нас все скрывает. Чиновники действительно пытаются что-то сделать, чтобы все работало более корректно, но пока данные не публикуются. 

Давид Френкель

Журналист издания «Медиазона».

– Мы считаем, что все плохо и с оперативными данными по коронавирусу. И причины тут, наверное, две. Первая – государственные органы столкнулись с огромным объемом работы и большими сложностями. Например, люди в деревнях просто не регистрируют смерти и не говорят, что у них кто-то умер. Это проблема, например, Кавказа. И в Ингушетии, и в Дагестане нам говорят, что нельзя посчитать умерших, потому что люди оставляют их у себя в деревне и не сообщают властям об их смерти. Росстат оказался к такому не готов.

Другая проблема, что местные чиновники действительно заинтересованы скрывать реальное положение дел. Всем известны графики из Краснодарского края, судя по которым в регионе каждый день одинаковое количество заболевших – 99,98 человек в сутки. Как такое может быть, никто не понимает. Можно догадываться, что есть некий психологический барьер – чиновники не хотят, чтобы было трехзначное число заболевших. 

Изображение: данные «Медиазоны» по коронавирусу
Изображение: данные «Медиазоны» по коронавирусу.

Конечно, доверять таким данным, мягко говоря, сложно. И весь наш проект, посвященный коронавирусу в России, был построен на том, что мы с самого начала не могли доверять данным в официальных публикациях. Нам хотелось разобраться и понять, какие реально данные. Отсюда родились все наши графики и карты. 

Мы хотели понять реальную смертность. В Москве первый умерший от коронавируса официально умер как бы не от коронавируса. Всем известно, что у человека положительный тест, были последствия заболевания. Но были у него и хронические болезни, поэтому в статистику он не попал. Зная, что в Москве есть умерший, но его никто не учитывает, мы решили, что так не пойдет. 

Надо было понять, насколько реально эпидемия влияет на людей. Тогда мы выработали для себя четкий критерий. Если мы знаем достоверно, что у человека есть положительный тест на коронавирус и он точно умер, то нам не важно, какова причина смерти – инфаркт или даже ДТП. Любого человека, который попадал под критерий, мы записывали в умершие от коронавируса. И очень быстро опередили официальную статистику.

Сбор данных стал крайне кропотливой работой с огромным количеством регионов. Мы рассылали запросы. Если приходили отписки, писали заново. Если нам не отвечали, звонили по телефонам и просили сообщить, сколько умерло людей. Следили за новостями агентств, и каждого умершего выписывали вручную в статистику. Тратили на это довольно много времени.

Изображение: данные «Медиазоны» по коронавирусу
Изображение: данные «Медиазоны» по коронавирусу.

Московским данным вначале мы доверяли, региональным нет. Доходило до курьезных случаев. Пример из Кировской области, когда число активных заболевших коронавирусом в какой-то момент стало отрицательным. Как это получилось? Очень просто. На начальном этапе регион завышал количество выздоровевших, к ним записывали всех, кто даже был просто под подозрением на коронавирус. А в количество заболевших записывали только тяжелых больных.  

Не могу сказать, что в России какие-то очень открытые данные. Чиновники не всегда готовы ими делиться. Некоторые регионы, например Московская область, открытым текстом отказались нам сообщать данные. Мы видим, что публикации о реальной ситуации плюс еще просто стандартное недоверие людей к официальной статистике заставляют эту машину как-то шевелиться. Но у меня пессимистичный вывод. 

Все усилия показать, что на самом деле происходит, привели к тому что данные пошли в полный разнос. Доверять этим данным стало совершенно невозможно. 

Давид Френкель

Для нашего исследования о том, сколько в России погибло медиков от коронавируса, мы взяли за основу данные активистов. Суть была в том, чтобы официальными данными чиновников подтвердить гражданские данные. На тот момент, когда мы начинали это делать, в списке было 200 человек. Нам удалось подтвердить 186 случаев.

В тот момент у Минздрава, видимо, вообще не было подобной информации. Через несколько недель после нашей публикации они стали давать статистику. Видимо, произошла какая-то реакция. Они поняли, что много людей умирает. Это была реакция на публичность. Гласность – лучший метод борьбы и защиты для активистов, который работает в России.