«Ревновал, избивал»: как «Алгоритм Света» ищет синонимы домашнего насилия в приговорах

Создательницы «Алгоритма Света» о том, как работает программа Изображение: «Алгоритм Света».

Каждый год в России тысячи женщин становятся жертвами домашнего насилия. При этом официальная статистика не отражает настоящих масштабов насилия в отношении женщин в России, например, потому что в нее не попадают случаи, когда преступление было совершено партнером или бывшим супругом. Сколько на самом деле женщин погибают дома, решили выяснить создательницы проекта «Алгоритм Света». Они создали программу, которая ищет синонимы домашнего насилия в текстах судебных приговоров. О том, как работает алгоритм и что удалось выяснить с помощью программы, команда проекта рассказала Теплице.

Ноль баллов

Екатерина Телькина была жестоко убита в середине марта 2020 года в собственной квартире в Москве. Женщина несколько раз обращалась в полицию с заявлениями на своего сожителя о побоях. В день убийства она дважды вызывала полицейских, звонили в полицию и соседи, которые слышали крики и просьбы о помощи. Но Екатерине никто не помог. Полицейские приехали, постояли у закрытой двери и уехали. Тело Екатерины Телькиной нашел ее родной брат. Двое суток рядом с трупом матери находилась годовалая дочь. 

В январе 2018 года полицейский Сергей Гусятников нанес своей жене, Елене Вербе, 57 ударов ножом. Так он отреагировал на новость о том, что Елена хочет с ним развестись. После убийства мужчина уехал на работу, оставив маленького ребенка рядом с трупом матери. На суде Гусятников требовал не лишать его родительских прав. 

Это лишь несколько историй, которые были на сопровождении у команды «Центра защиты пострадавших от домашнего насилия», на самом деле таких случаев намного больше. По данным отчета Всемирного банка «Women, Business and the Law», за 2018 год Россия набрала ноль баллов в области законодательства по защите прав женщин — в стране не приняты законы о домашнем насилии, домогательствах на рабочем месте, а в Уголовном кодексе нет статьи о сексуальном насилии на работе. 

Как на войне

Есть проблемы и со статистикой потерпевших от преступлений в семье. В нее попадают только случаи, по которым были возбуждены уголовные дела, и преступление было совершено членами семьи: супругами, родителями, братьями, сестрами и другими кровными родственниками. И не попадают случаи, когда преступление было совершено партнером, с которыми не был заключен брак, или бывшим супругом.

Последний отчет Росстата о «Репродуктивном здоровье населения», в котором содержалась информация о домашнем насилии, был опубликован в 2011 году и содержал лишь опросные данные. Статистика МВД по побоям не вызывает доверия. Внутренняя статистика, которую ведут профильные некоммерческие организации, также не может отражать полную картину партнерского и семейного насилия в России. 

Ответ на вопрос, каков на самом деле процент женщин, погибающих дома в ситуации домашнего насилия, искала команда проекта «Близким лицом близкому лицу». Проект победил на хакатоне «Прожектор 2021», организованном Теплицей социальных технологий и «Новой Газетой». Проанализировав судебные решения, команде удалось выяснить долю женщин, погибших, будучи в близких отношениях, от рук родственника или партнера, по сравнению с общим количеством убитых женщин. 

Слайд презентации на хакатоне «Прожектор 2021».
Слайд из презентации на хакатоне «Прожектор 2021».

По данным Росстата, за 2018 год всего было убито 8300 женщин. Речь идет об общем числе женщин, потерпевших от преступных посягательств. Юристы и правозащитники во время первого этапа проекта выяснили, что 61% от общего числа убитых женщин в 2018 году были убиты партнерами или родственниками. То есть минимум 5000 из них были убиты в ситуации домашнего насилия. 

Участницы хакатона решили не останавливаться на одном исследовании и создать программу, которая выявляет факт домашнего насилия в приговорах по статьям, подразумевающим убийство человека. Так появился проект «Алгоритм Света». Сам алгоритм создала программистка Светлана Жучкова, данные для его обучения разметили сотрудницы «Консорциума женских неправительственных объединений» и команда юристок и специалисток, работающих с темой домашнего насилия. 

В нашу небольшую команду входили в основном юристки. С кем-то из них мы уже были знакомы по предыдущим проектам. Некоторые имеют опыт сотрудничества с нашими партнерскими НКО. Были и те, кто не имел юридического образования, но работали в профильных организациях, хорошо разбирались в теме домашнего насилия.

160043244 1352035435162604 3256645706078438662 n 150x150 - «Ревновал, избивал»: как «Алгоритм Света» ищет синонимы домашнего насилия в приговорах

Саша Граф,

руководительница проекта

Создательницы проекта объявили открытый набор. С каждой из потенциальных участниц проводили собеседование, чтобы понять уровень знаний и готовность часами сидеть над тяжелыми для восприятия приговорами. По словам Саши Граф, команде было важно контролировать весь процесс, чтобы избежать ошибок в методологии, поэтому все встречи проводили в Москве очно.

В итоге, проанализировав с помощью «Алгоритма Света» 81 136 приговоров с 2011 по 2019 год, создательницы программы выяснили, что ежегодно 66% убитых женщин становились жертвами домашнего насилия. Исходя только из опубликованных приговоров, за это время 12 209 из 18 547 женщин погибли от рук партнера или родственника. Чтобы понять, много это или мало, экспертки приводят в пример Афганскую войну, когда за 10 лет погибло 14 427 советских военнослужащих. В мирное время за девять лет от рук близких людей женщин погибло почти столько же, сколько людей во время войны. 

Синонимы насилия 

Чтобы получить такую статистику, создательницы «Алгоритма Света» исследовали тексты судебных приговоров, вынесенных с 2011 по 2019 год. Они выбрали три статьи Уголовного кодекса — статью 105 (убийство), статью 111 часть 4 (умышленное причинение тяжкого вреда здоровью, повлекшее по неосторожности смерть потерпевшего) и статью 107 (убийство, совершенное в состоянии внезапно возникшего сильного душевного волнения). 

Остальные преступления, связанные с насилием в отношении женщин, они не рассматривали. Создательницы отмечают, что статистика пока может быть неполной — отдельного изучения требует проблема смертности женщин в результате несчастного случая, самоубийства и ситуации, когда женщина пропала без вести. 

Тексты приговоров были взяты из двух источников: портал ГАС РФ «Правосудие» и сайт Мосгорсуда — они открыто предоставляют информацию о судебном делопроизводстве в России. Из них команда проекта скачала все доступные тексты приговоров по статьям 105, 107, 111 ч. 4 УК РФ и вначале вручную отделила около сотни дел, в которых убитыми являлись женщины. 

В этих приговорах специалистки нашли повторяющиеся слова и фразы, которые были использованы для описания преступления против женщины: скончалась, смерть потерпевшей, мертва, погибшая, убил ее, труп женщины и другие. После дополнительной проверки команда оставила семь наименее противоречивых фраз, говорящих об убийстве женщины. По этим ключевым словам и фразам специальная программа, способная учесть разные формы слов, уже автоматически отбирала из тысяч приговоров те, в которых убитыми являлись женщины. 

Для обучения «Алгоритма Света» команда проекта взяла опубликованные приговоры за 2018 год. Среди них 1710 были вынесены за убийство женщин — эти приговоры специалистки прочитали и промаркировали вручную на наличие или отсутствие домашнего насилия, то есть помечали, было ли убийство совершено партнером или родственником, и если да, то кем именно. Затем команда выборочно перепроверяла маркировку на соответствие методологии. Промаркированные приговоры создательницы проекта разделили на две части: 90% участвовали в обучении моделей, на этих приговорах алгоритм учился выявлять закономерности, остальные 10% использовались для проверки его точности. 

Суть работы алгоритма в том, что он соотносит текст приговора с отметкой, которую мы заранее проставили вручную, и учится искать закономерности: какие слова и выражения встречаются чаще в приговорах, где женщин убил партнер или родственник, а какие — в остальных приговорах.

2018 10 03 01.38.53 150x150 - «Ревновал, избивал»: как «Алгоритм Света» ищет синонимы домашнего насилия в приговорах

Светлана Жучкова,

создательница алгоритма

Светлана Жучкова объясняет, что все тексты заранее специальным образом подготавливаются: удаляются лишние символы и не несущие смысловой нагрузки слова, остальные слова приводятся к начальной форме. В итоговой версии алгоритма используется одна из классических моделей машинного обучения — градиентный бустинг, и вывод по приговору делается на основе отдельных слов или двух стоящих рядом слов, более длинные выражения не учитываются. Этого оказалось достаточно для получения высокого качества прогноза.

Из-за того, что термин «домашнее насилие» не имеет правового определения, его нельзя встретить в текстах приговоров. Но можно его синонимы — команда проекта собрала таблицу таких слов и фраз, полученных в ходе работы алгоритма. Читая приговор, алгоритм двигается по шкале «не домашнее насилие — домашнее насилие». Когда в теле приговора он считывает слова или фразы, которые при обучении часто встречались в делах о домашнем насилии, он делает шаг в сторону домашнего насилия. Когда он встречает слова или фразы, свойственные приговорам, в которых нет домашнего насилия, то делает шаг назад. 

Прочитывая таким образом весь приговор, алгоритм делает итоговый вывод. Для изучения массива в десятки тысяч приговоров алгоритм можно считать эффективным, если его показатели выше 80%. «Алгоритм Света» определяет факт домашнего насилия с точностью 86%. При расчете итоговой статистики по годам команда постаралась учесть, что алгоритм может ошибаться, поэтому все финальные цифры указаны с поправкой на точность алгоритма.

Также алгоритм может установить связь между преступником и жертвой, то есть определяет, кто именно совершил преступление — партнер или родственник. И делает это с точностью 94%. В итоге команде удалось выяснить, что в приговорах, содержащих факт домашнего насилия, 81% женщин погибают от рук партнеров — с 2011 по 2019 год в 9868 опубликованных приговорах женщины были убиты своими партнерами. Оставшиеся 19% погибают от рук родственников. Это соотношение остается стабильным из года в год, изредка меняясь на один процентный пункт.

Больше данных

Создательницы «Алгоритма Света» изучили большинство приговоров, которые выносили преступникам в России с 2011 по 2019 год по трем выбранным статьям. Но не все вынесенные приговоры попадают в открытый доступ. Ряд приговоров не публикуется в принципе, если в их тексте содержится информация о преступлениях против половой неприкосновенности (которые мужчина мог совершить до или после убийства женщины), о совершении преступления невменяемым лицом и иная информация

Еще часть приговоров не доходит до ГАС «Правосудия» из-за высокой нагрузки региональных судов. Скорее всего, они просто не успевают направить в систему все вынесенные решения. Кроме того, практически все приговоры по этим статьям обжалуются, до 19% осужденных в итоге получают замену наказания или отмену приговора — то есть в это время находятся в «серой зоне». Искать реальное количество преступлений против женщин необходимо гораздо раньше, уверена команда проекта «Алгоритм Света».

Отчеты Росстата содержат информацию о погибших от преступных посягательств женщин. Что именно входит в этот список, команде «Алгоритма Света» понять не удалось. Росстат публикует статистику на основе данных, разрабатываемых правоохранительными органами. В этой длинной цепочке официальной статистики все начинается с МВД.

Создательницы алгоритма отправили адвокатский запрос о количестве женщин, погибших от преступлений, предусмотренных статьями 105, 107 и 111 ч. 4, и получили ответ. В 2018 году, по данным МВД, их было 3763. Опубликованных приговоров в два раза меньше — 1710. Такой же запрос команда направила в генеральную прокуратуру и следственный комитет, но ответ не получила.

Дополнительные материалы