Как машинное обучение помогает активистам: итоги хакатона Теплицы в Санкт-Петербурге

Победителем стала команда правозащитного проекта «Женщина.Тюрьма. Общество»

Защитить права заключенных в России, посчитать реальную явку на выборах, найти пропавших животных, выстроить новый маршрут для автобуса, в котором можно бесплатно сдать экспресс-тесты на ВИЧ. Эти и другие задачи решали участники с помощью машинного обучения на исследовательском хакатоне Теплицы 16 и 17 февраля 2019 года в Санкт-Петербурге. Победителем хакатона стала команда правозащитного проекта «Женщина.Тюрьма. Общество».

Всего на хакатоне представили 15 идей. Участники предлагали решать социальные проблемы в четырех сферах: безопасность, экология (чистый город), самоуправление и гражданская активность, инклюзивность – 4SPB.

Проекты оценивали члены жюри:

  • Александр Сидоренко, руководитель Теплицы социальных технологий;
  • Ольга Пархимович, аналитик, преподаватель ИТМО, куратор проекта Госзатраты;
  • Александр Зверянский, data scientist, ML-эксперт, со-основатель Advance.Careers;
  • Лилия Земнухова, социолог, научный сотрудник Центра исследований науки и технологий ЕУСПб, автор канала WrongTech;
  • Виталий Власов, эксперт в области открытых данных, преподаватель ИТМО.

Победитель хакатона: проект «Тюремный F#ck»

Команда проекта проанализировала схемы вовлечения заключенных в оказание сексуальных услуг и производство запрещенного видео. Идея принадлежит активистам правозащитной организации «Женщина.Тюрьма. Общество».

Тюремный F#ck – это часть журналистского расследования о том, как российских заключенных насильно вовлекают в оказание коммерческих сексуальных услуг, в съемки и распространение запрещенного контента.

Команда проекта: Леонид Агафонов – автор проекта «Женщина. Тюрьма. Общество», Наталия Донскова – журналист, Алексей Сергеев – дизайнер, Тимур Охинько, Анастасия Никольская – технические решения. Фото: Елизавета Заславская.
Команда проекта. Фото: Елизавета Заславская.

На хакатоне команда проанализировала 10 тематических групп в соцсетях. Для обучения моделей для анализа использованы 800 объявлений и 80 текстов, близких по содержанию.

Команда проекта: создатель организации «Женщина. Тюрьма. Общество» Леонид Агафонов, журналистка Наталия Донскова, дизайнер Алексей Сергеев, технические специалисты Тимур Охинько и Анастасия Никольская.

Подробней о проекте читайте в финальной презентации.

Победитель народного голосования: проект FoodBot

Проект ВК-бота для движения фудшеринга по спасению еды от утилизации в Петербурге победил в голосовании среди участников хакатона в номинации «Приз зрительских симпатий».

Команда разработала чат-бот. Он решит несколько важных проблем по организации обмена продуктов. Поможет быстрее обрабатывать информацию, публикуемую в группе в ВКонтакте, и оптимизировать распределение забора продуктов.

Команда проекта: Андрей Гуров — Product Manager, Артём Бухтояров — Software Engineer, Иван Забродин — Software Engineer, Алекс Семёнов — Software Architect (Molinos Dev Team) и Саша Лёгкая – основатель движения Foodsharing СПб. Фото: Елизавета Заславская
Команда проекта. Фото: Елизавета Заславская

Чат-бот умеет отслеживать объявления в группе ВКонтакте, подсказывает пользователям, какие продукты чаще всего отдают и какие продукты уже отдали за последнее время.

«Благодаря оптимизации работы координаторов и участников сообщества проект фудшеринга сможет спасти больше еды от утилизации». Саша Легкая, основатель движения

Кроме того, бот обучен уведомлять авторов о нераспознанных адресах в объявлениях, распределять продукты и показывать статистику.

Чат-бот будет подсказывать, что чаще всего отдают и какие продукты уже отданы. Скриншот диалога бота и пользователя.
Чат-бот будет подсказывать, что чаще всего отдают и какие продукты уже отданы. Скриншот диалога бота и пользователя.

Автор идеи – основатель движения Саша Легкая. Разработкой занималась команда Molinos Dev Team.

Команда проекта: Андрей Гуров – Product Manager, Артем Бухтояров – Software Engineer, Иван Забродин – Software Engineer, Алекс Семёнов – Software Architect и Саша Легкая – основатель движения Foodsharing СПб.

Посмотреть финальную презентацию проекта можно по ссылке. Код разработки выложен в репозитории на Gitlab. Результаты проектирования по ссылке.

Проект по обнаружению компьютерным зрением незаконной рекламы на фасадах зданий

Команда проекта работает с проблемой нелегальной рекламы. Фасады и окна зданий завешивают и закрывают нелегальными вывесками и конструкциями. В Петербурге это приобрело массовый характер. Следить за соблюдением законодательства должны аудиторы, также на нарушения могут подавать жалобы граждане, например, через портал «Наш Санкт-Петербург». Однако без автоматизации этого процесса решить городскую проблему сложно.

Команда проекта: Юстина Иванова, Олег Кисельников, Кирилл Бочкарев. Фото: Елизавета Заславская.
Команда проекта. Фото: Елизавета Заславская.

Для решения проблемы команда использует панорамные карты и компьютерное зрение, чтобы на изображениях выявлять нелегальную рекламу на фасадах зданий. На хакатоне классифицировали изображения с вывесками, консольными вывесками, баннерами в окнах, подготовлены данные – 249 изображений. Обучение моделей проводилось в программе Yolo.

Цель работы – создать инструмент по распознаванию изображений. Он поможет сократить число незаконных вывесок на зданиях Петербурга.

Команда проекта: Юстина Иванова, Олег Кисельников, Кирилл Бочкарев.

Подробней о проекте вы можете прочитать в финальной презентации по ссылке. Код разработки выложен в репозитории.

Посмотрите видеозапись защиты проектов хакатона на Youtube-канале Теплицы. Фотографии мероприятия выложены в Facebook.

Как данные могут помочь предотвратить опасное поведение детей

Авторы проекта Иван Федоров, Иван Носков занимались анализом данных страниц в социальных сетях для отслеживания изменений эмоционального состояния детей. Такой анализ нужен для создания инструмента для психологов и родителей по мониторингу сообщений и изображений, публикуемых детьми на страницах в соцсетях.

Мониторинг онлайн-активности поможет выявить отклонение в поведении ребенка и указать на опасное изменение эмоционального состояния.

Команда проекта: Иван Федоров, Иван Носков. Фото: Елизавета Заславская
Команда проекта: Иван Федоров, Иван Носков. Фото: Елизавета Заславская.

В планах разработать бот в Telegram или «ВКонтакте», который позволит собрать и проанализировать данные.

Подробнее о проекте вы можете прочитать в финальной презентации по ссылке.

Аналитика портала «Наш Петербург»

Команда проекта исследовала обращения горожан на портале «Наш Петербург». Цель исследования – составить подробную картину о гражданской активности петербуржцев.

Команда проекта: Стив Каддинс, Екатерина Ильина, Ольга Ващенкова, Александр Антонов. Фото: Елизавета Заславская.
Команда проекта: Стив Каддинс, Екатерина Ильина, Ольга Ващенкова, Александр Антонов. Фото: Елизавета Заславская.

Данные с портала «Наш Петербург» позволили изучить электронное участие горожан, узнать, как развивается гражданская активность, чем занимаются активисты.

Команда проекта: Стив Каддинс, Екатерина Ильина, Ольга Ващенкова, Александр Антонов.

Подробней о том, какие аномалии позволил выявить анализ данных, вы можете прочитать в презентации проекта.

Бот для поиска потеряшек Findpet

Findpet – это бот для автоматизированного поиска потерявшихся кошек и собак по их фотографиям.

Проект поможет хозяевам решить проблему неэффективности ручного поиска фотографий и собрать единую базу потерявшихся животных.

Команда проекта: Ольга Карпенок, Елена Занина, Катерина Каминская, Максим Ермоленко, Борис Ковешников. Фото: Елизавета Заславская.
Команда проекта. Фото: Елизавета Заславская.

В бот интегрирована полноценная обучающаяся нейронная сеть, создана и подключена база данных с релевантным контентом.

Владельцы потерявшихся питомцев загружают фотографии и получают выдачу релевантных изображений из единой базы животных. Это повышает вероятность найти питомца и снижает число без вести пропавших животных.

Вк-бот поможет владельцам найти своих пропавших питомцев. Скриншот: диалог бота и пользователя.
Вк-бот поможет владельцам найти своих пропавших питомцев. Скриншот: диалог бота и пользователя.

Команда проекта: Ольга Карпенок, Катерина Каминская, Максим Ермоленко, Борис Ковешников.

Код разработки выложен в репозитории на GitHub.

Если вы хотите следить за обновлениями проектов или связаться с авторами и включиться в реализацию, вступайте в чат хакатона.

Новый маршрут для «Синего автобуса»

Фонд «Гуманитарное действие» занимается помощью людям, употребляющим наркотики. Одна из программ – мобильный пункт профилактики, специально оборудованный автобус, в котором работает команда квалифицированных специалистов. Эта программа называется «Синий автобус».

За два дня команда проекта проанализировала данные, определила критерии эффективности точек мобильных пунктов профилактики, построила прогнозирующую модель. Это нужно для того, чтобы найти новые точки стоянки автобуса в разных районах города.

Команда проекта: Кирилл Грачев, Роман Малюшкин, Сергей Чувакин, Роман Скочилов, Екатерина Зингер, Алексей Лахов, Наталья Филиппова. Фото: Елизавета Заславская.
Команда проекта: Кирилл Грачев, Роман Малюшкин, Сергей Чувакин, Роман Скочилов, Екатерина Зингер, Алексей Лахов, Наталья Филиппова. Фото: Елизавета Заславская.

«Есть точки, на которые приходит много клиентов, а есть стоянки, где клиентов мало. Чтобы понять, где дело в нас, а где – в самом районе или в других факторах, мы взяли нашу статистику по количеству визитов и розданного профилактического материала, и наложили ее на данные городской антинаркотической комиссии за 2017 год (у нас были только эти данные). Сейчас мы хотим собрать официальные данные за 16 и 18 годы, наложить на собственные цифры и посмотреть картину в динамике», – описывает процесс работы Алексей Лахов.

Еще по теме: Как данные НКО помогают решить социальные проблемы: итоги хакатона Теплицы в Санкт-Петербурге

Для обучения модели использовались следующие данные: внутренние данные фонда о работе автобуса с 2010 по 2019 гг.; информационные бюллетени Центра СПИД, данные Антинаркотической комиссии Санкт-Петербурга и Росстата.

Для построения модели использовались данные фонда, Антинаркотической комиссии и Росстата. Фрагмент сайта haf-spb.org/hackaton-2019/
Для построения модели использовались данные фонда, Антинаркотической комиссии и Росстата. Фрагмент сайта haf-spb.org/hackaton-2019/

«С помощью машинного обучения мы будем прогнозировать места новых стоянок, опираясь не только на внутренние данные и официальную статистику, но и на другие переменные, которые затем будут обработаны искусственным интеллектом». Алексей Лахов, фонд «Гуманитарное действие»

Команда проекта: Кирилл Грачев, Роман Малюшкин, Сергей Чувакин, Роман Скочилов, Екатерина Зингер, Алексей Лахов, Наталья Филиппова.

Результаты работы на хакатоне можно посмотреть по ссылке. Код разработки выложен в репозитории на GitHub. Подробней о проекте читайте в финальной презентации.

Открытый протокол

Участники движения «Наблюдатели Петербурга» занимаются общественным мониторингом и следят за законностью проведения выборов.

У движения уже есть telegram-бот, который в день выборов собирает от наблюдателей фотографии протоколов голосований. Далее необходимо их быстро распознать и внести в сводную таблицу. Наблюдатели столкнулись с тем, что Центральная избирательная комиссия перемешивает все данные в QR-коде протоколов голосования. Поэтому приходится расставлять данные вручную, это слишком долгий процесс, который снижает эффективность процесса наблюдения и обработки информации по выборам.

Команда проекта: Елена Ларичева, Евгений Пустозеров, Лев Крыленков. Фото: Елизавета Заславская.
Команда проекта: Елена Ларичева, Евгений Пустозеров, Лев Крыленков. Фото: Елизавета Заславская.

На хакатоне команда проекта «Открытый протокол» занималась распознаванием и сравнением текстов, чтобы корректно собирать данные из протоколов.

Подробней о проекте вы можете прочитать в финальной презентации.

Проект «Для детей»

Команда создавала приложение, которое показывает детям развивающие картинки с соответствующим звуковым сопровождением в режиме слайд-шоу. Выключение и смена картинок возможны в том числе с помощью голосового управления (например, реагирование на плач ребенка).

Дальнейшее развитие проекта – это генерация картинок в стилях, соответствующих тому или иному возрасту и уровню развития детей, на основе обычных фотографий.

Команда проекта «Для детей». Фото: Елизавета Заславская.
Команда проекта «Для детей». Фото: Елизавета Заславская.

Данные и технологии, которые использовались в проекте: датасеты со звуками, исходящими от детей (плач, смех, тишина, шум); датасеты картинок для детей разного возраста; Neural Style Transfer c TensorFlow для генерации новых картинок; sklearn для классификации звуков (в частности плача).

Подробней о проекте вы можете прочитать в финальной презентации.

Кому можно помочь

Некоторые проекты хакатона не участвовали в финальной защите. Возможно, они вас заинтересуют и вы сможете помочь им в реализации.

1. Почта России. Проект по трек-анализу писем и посылок. Идея – предсказать время в пути посылок и выявить неэффективные пункты Почты России.

Планировалось на основе собранных данных улучшить предсказания, выявить плохо организованные сортировочные пункты и отделения, прогнозировать риски задержки и потери посылок для магазинов.

Автор идеи – Алексей Орлов. Подробней о проекте вы можете прочитать в презентации.

Еще по теме: Лучшие онлайн-кампании 2018 года

2. «Чистые Игры». Это экологический фестиваль, который включает в себя различные форматы: командный квест по 
сбору и сортировке 
мусора, спортивные, творческие, интеллектуальные активности.

Фестиваля масштабируется как некоммерческая франшиза. С развитием проекта людей, желающих организовать и провести игру, становится все больше – сейчас их более 500 человек. Их необходимо координировать и отвечать на типовые вопросы. Сейчас это делает один сотрудник.

Часть команды проекта Чистые Игры. Фото: Елизавета Заславская.
Часть команды проекта «Чистые Игры». Фото: Елизавета Заславская.

Для эффективной работы фестивалей нужен ВК-бот, который автоматизирует рутинную часть общения с организаторами, ответы на типовые вопросы и отправку сообщений по расписанию.

Автор проекта – Дмитрий Иоффе. Подробней о проекте вы можете почитать в презентации.

3. Проект «Приговор 228». Команда проекта занимается парсингом опубликованных приговоров по 228-й статье УК РФ. Эта работа необходима для получения качественной информации, подтверждающей, что российская политика негуманна в отношении людей, употребляющих наркотики.

Часть команды проекта – Глеб Пайкачев. Фото: Елизавета Заславская.
Часть команды проекта – Глеб Пайкачев. Фото: Елизавета Заславская.

Технологии машинного обучения нужны, чтобы добиться большей полноты сбора данных и избежать ручного написания правил. Работа включает парсинг приговоров, анализ и их обработку.

Цель проекта – инициировать обсуждение смягчения наказаний по статье 228. Подробней о проекте вы можете почитать в презентации.

4. Проект Imprecity. Команда изучает эмоции горожан для анализа городской среды. Ранее разработан концепт приложения Imprecity – это персональный дневник, где пользователь отмечает свои эмоции и впечатления об общественных пространствах города.

В основе лежит концепция базовых эмоций Пола Экмана – радость, злость, грусть, страх, отвращение и удивление.

Приложение выдает статистику и эмоциональные треки пользователя за месяц. Это позволяет установить взаимосвязь между опытом пользования городской средой и субъективным состоянием человека.

Команда проекта Imprecity. Фото: Елизавета Заславская.
Команда проекта Imprecity. Фото: Елизавета Заславская.

Дальнейшее развитие проекта предполагает разметку и анализ записей из TripAdvisor. Это 50767 комментариев и 1290 мест Санкт- Петербурга и Ленинградской области. Проекту нужна помощь в оптимизации алгоритма распознавания эмоций по шести классам в текстах пользовательских отзывов.

Подробней о проекте вы можете почитать в презентации.

5. Платформа AllGood. Нужна для бонусного вознаграждения добрых дел. Задача команды – привлечь людей к благотворительности и создать «сервисный» интерфейс с механизмами вознаграждения («кэшбек за добро»).

Проект AllGood, Пётр Андрющенко. Фото: Елизавета Заславская.
Проект AllGood, Пётр Андрющенко. Фото: Елизавета Заславская.

Необходимо разработать механизм автоматического присвоения некоторой ценности в баллах определенным видам волонтерских задач, в зависимости от спроса и предложения.

Подробней о проекте вы можете почитать в презентации.

6. Проект Naomi. Олег Савельев представил проект по разработке бота – голосового помощника. В отличие от существующих возможностей, весь пользовательский трафик будет зашифрован и не будет храниться.

Олег Савельев, проект Naomi. Фото: Елизавета Заславская
Олег Савельев, проект Naomi. Фото: Елизавета Заславская.

Если вы хотите связаться с авторами проектов или задать вопросы командам, вступайте в чат хакатона в Telegram.

Теплица социальных технологий выражает благодарность людям, инициативам и организациям, которые поддержали хакатон:

  • Ильдару Белялову, эксперту по deep learning, директору мастерской Летней школы по глубинному обучению;
  • Ирине Радченко, кандидату технических наук, доценту (ИТМО), аналитику и тренеру;
  • Николаю Овчинникову, редактору медиа «Команда 29», Афиша;
  • Наталье Барановой, главному редактору сайта Теплицы социальных технологий;
  • Бизнес-инкубатору Ингрия Технопарка Санкт-Петербурга и лично Татьяне Ушаковой;
  • Проектному центру Инфометр и Команде 29;
  • Университету ИТМО и Лаборатории качества городской жизни;
  • Агентству цифровых коммуникаций Molinos и лично PR-директору Ольге Антоновой;
  • Информационным партнерам:«Типичному программисту», Russian Hackers, IT-школе Epic Skills;
  • Проекту «Еда спасет мир» и лично Анне и Илье;
  • Волонтеру Виталию из проекта Работа-i.
  • В организации и проведении хакатона активно помогали Виталий Есипов (сопровождение проектов хакатона), Катерина Каминская (менеджер IT-проектов), Елизавета Заславская (менеджер IT-проектов, фотограф мероприятия).

Посмотреть защиту проектов и фотографии.