Сделать проблему видимой: как и зачем активисты собирают данные

Как активисты могут собирать данные, которых нет ни у кого другого, и почему с этим стоит быть осторожнее

Часто для решения социальной задачи журналисты и активисты хотят обратиться к данным. При этом данных часто может не быть или они могут быть недоступны. Они распределены неравномерно: у некоторых групп и институтов доступ к ним заведомо более обширный, чем у других.

Исторически именно государство собирало большой массив данных о своих гражданах, но, несмотря на усилия движения за открытые данные по всему миру, до сих пор огромная часть информации, которая могла бы быть полезна активистам, журналистам и исследователям, остается недоступной. Схожая ситуация наблюдается и с бизнесом, где данные зачастую являются коммерческой тайной и стратегическим преимуществом одних компаний над другими. И при этом открытость данных – только часть проблемы. 

С другой стороны, некоторые важные данные просто не собираются. Именно этой проблеме посвящен арт-проект Мими Онуохо «Библиотека упущенных наборов данных» (Library of Missing Data Sets), в котором она собрала карточки с названиями значимых наборов данных, по какой-то причине отсутствующих. 

  • Мобильность для пожилых людей с физическими недостатками или когнитивными нарушениями.
  • Дискриминация в отношении ЛГБТ людей пожилого возраста в жилищной сфере.
  • Не имеющие документов иммигранты, которые в настоящее время находятся в заключении и/или получают низкую заработную плату.
  • Сколько Spotify платит каждому из музыкантов за песню.
  • Информация о пользователях глобального веба, учитывающая общие устройства и использование VPN.

Оказывается, сбор данных не настолько нейтральный феномен. Он тесно связан с отношениями власти, поскольку всегда неявно стоит вопрос, какие данные вообще стоит собирать, а какие нет. С этим связана определенная прагматика, потому что сбор одних данных расценивается как полезный, прибыльный, а других – как ненужный, необязательный или вредный. Поэтому нам важно думать не только о том, как данные собираются, но и о том, почему именно эти данные оказались собраны. 

Источник: изображение с веб-страницы проекта «Библиотека упущенных наборов данных».

При этом часто социальная проблема требует немедленного действия, и у заинтересованных сторон нет времени ждать, пока важные данные будут собраны государством и станут доступны для использования. Через рассмотрение журналистского проекта The Counted с сильным активистским посылом, я хочу показать, как данные собирались разными способами с целью социальных изменений. 

Мобилизация публики вокруг данных

Все началось, когда 9 августа 2014 года в Фергюсоне, штат Миссури, афроамериканский мужчина Майкл Браун был несправедливо застрелен полицией. Дело получило широкую огласку – во многом именно оно стало катализатором движения Black Lives Matter, и, в частности, оно привлекло внимание к проблемам сбора данных об убийстве полицейскими американских граждан. Конечно, это было далеко не первое подобное дело в Штатах, однако во многом оно спровоцировало такое общественное недовольство. Официальная государственная статистика была неполной, неточной, а с ее агрегированием на национальном уровне были организационные и процедурные сложности. Более того, офицеры полиции в то время не всегда были обязаны отправлять отчет о смерти обычных граждан при исполнении служебных обязанностей. 

Поэтому журналисты американского The Guardian решили сами восполнить эту лакуну в настолько значимых для общественности данных. Они оказываются особенно нужны, когда возникает социальная потребность понять, действительно ли определенные группы диспропорционально больше оказываются жертвами полицейского насилия. Как говорят сами журналисты, без надежных данных невозможно установить реальный масштаб проблемы и начать действовать. 

Источник: скриншот базы данных с сайта The Guardian.

Команда The Guardian собрала свою собственную базу данных смертей, связанных с деятельностью полицейских в США в 2015 и 2016 годах. При ее составлении они мониторили местные новости, звонили в морги, организовали форму, через которую все желающие могли отправлять им подсказки. Они также обращались к таким уже существовавшим краудсорс-инициативам по сбору данных о полицейском насилии, как проекты Killed by the Police и Fatal Encounters. Вокруг The Counted образовалось целое сообщество людей, небезразличных к теме полицейского насилия. Как итог, журналистам удалось собрать базу данных, рассказать множество историй погибших людей и написать ряд статей о проблемах полицейского насилия и американской статистики по этому вопросу. 

Более того, им удалось системно повлиять на сбор статистики по этому вопросу. В то время директор Федерального бюро расследования Джеймс Коми сказал, что это «недопустимо» и «постыдно», что статистика журналистского проекта оказывается лучше, чем государственная, за которую в том числе он несет ответственность. Статистическое управление юстиции США выпустило отчет, согласно которому существующая система регистрации полицейского насилия не учитывала примерно 54% смертей. В результате ФБР сейчас руководит программой национального масштаба, пытаясь понять, как представители правоохранительных органов обращаются к насилию при исполнении. 

Источник: скриншот базы данных с сайта The Guardian.

Проект The Counted – далеко не единственный пример того, как журналисты и активисты самостоятельно собирали статистику для того, чтобы предоставить данные о какой-то важной теме. Так, например, существовавший с 2013 по 2016 год проект The Migrant Files, объединивший профессионалов более чем из 15 стран Европы, был направлен на понимание масштаба смертей людей, пытающихся добраться до Европы. Авторы проекта собирали данные, рассказывали истории этих людей и их родственников и пытались понять, кто больше всего выигрывает от текущей политики в этой области. После первых опубликованных результатов проекта ряд организаций (например, Международная организация по миграции) запустили свои собственные инициативы по сбору этой информации. 

Две стороны сбора данных

Теперь я хочу вернуться к проекту Мими Онуоха. Обсуждая проблему отсутствия важных данных, она выделяет четыре причины, из-за которых это может происходить. 

  • Те, у кого есть ресурсы для сбора данных, не заинтересованы в этом (соответственно, зачастую те, кто имеет доступ к набору данных, это те же, кто имеет возможность удалить, скрыть или сделать их неясными).
  • Собираемые данные сопротивляются простой квантификации (соответственно, мы приоритезируем сбор данных, которые удобнее собирать).
  • Акт сбора данных требует большей работы, чем представляется возможная польза от них.
  • Отсутствие сбора определенных данных кому-то выгодно.

Важно иметь в виду, что у учета с помощью данных есть и обратная сторона. Если вас считают, то вас также учитывают, и это всегда работает в две стороны. Однако это означает, что голос прежде не услышанных групп и масштаб ранее не освещаемых в должной мере проблем становится видимым, но, с другой стороны, эта видимость может сыграть и в обратном направлении, делая определенные группы более уязвимыми. Яркий пример этого – история с картотекой Бюро статистики в Нидерландах в первой половине XX века. К 1939 году каждый гражданин должен был иметь документ, куда в том числе включалась графа «происхождение». После вторжения немцев в 1940 году эти данные были использованы для преследования еврейского населения и массовой депортации в концентрационные лагеря. Эта история показывает нам, как при сменяющихся политических условиях само наличие данных может ставить социальные группы в уязвимую позицию. 

Это означает, что вопрос о сборе данных и контроле над ними является не просто техническим, а тесно связанным с решением о том, кому мы доверяем данные о себе и на каких условиях. Для активистов это также означает, что необходимо в каждом конкретном случае рефлексировать, как сбор данных и видимость, которая через него приобретается, может повлиять на конкретных людей и общество в целом. В конечном счете, не всему обязательно становиться данными: вполне возможно, что некоторые аспекты нашей жизни лучше не превращать в зарегистрированную информацию. Но часто сбор данных важен для формулирования проблемы и создания социальных изменений, если мы внимательны по отношению к тому, как этот сбор устроен.

А как вам кажется, какие данные стоит собирать, а какие – нет? Поделитесь ответами в комментариях к статье.

Еще по теме

Самое популярное

Будьте с нами на связи, независимо от алгоритмов

Telegram-канал E-mail рассылка RSS-рассылка
Как победить алгоритмы: прочитай инструкции, как настроить приоритетный показ материалов в социальных сетях и подключить RSS-ленту.