Как ты, AI, ML и IoT можете остановить сексуальное насилие над детьми прямо сейчас

Казалось бы, машинное обучение (ML), искусственный интеллект (AI), распознавание лиц, the Интернет вещей (IoT) – все эти технологические решения должны были ускорить процесс поиска и облегчить задачу. Но все оказалось сложнее. Фото: Pexels.com (CC0).
Казалось бы, машинное обучение (ML), искусственный интеллект (AI), распознавание лиц, the Интернет вещей (IoT) – все эти технологические решения должны были ускорить процесс поиска и облегчить задачу. Но все оказалось сложнее. Фото: Pexels.com (CC0).

В 2015 году гене­раль­но­му дирек­то­ру ком­па­нии Thorn (Циф­ро­вая защи­та детей) Джу­ли Кор­дуа позво­ни­ли. Сле­до­ва­тель Мини­стер­ства внут­рен­ней без­опас­но­сти про­сил ее о помо­щи. Ему тре­бо­ва­лось най­ти тех­но­ло­ги­че­ское реше­ние, кото­рое помог­ло бы в поис­ке малень­кой девоч­ки. Ребе­нок стал жерт­вой сек­су­аль­но­го наси­лия, и видео­ро­ли­ки со сце­на­ми изде­ва­тель­ства над девоч­кой рас­про­стра­ня­лись по всей Сети.

Уже восемь меся­цев Депар­та­мент внут­рен­ней без­опас­но­сти без­ре­зуль­тат­но искал ребен­ка. Ее дан­ных и фото­гра­фий не было в базе про­пав­ших и экс­плу­а­ти­ру­е­мых детей. Никто не искал ее, не заяв­лял о про­па­же с того само­го момен­та два года назад, когда в Сеть было выло­же­но видео с актом наси­лия. Имен­но поэто­му дело по ее розыс­ку было откры­то так позд­но.

У Джу­ли Кор­дуа не было на руках ника­ко­го отве­та. Тем не менее ее коман­да раз­ра­бот­чи­ков при­сту­пи­ла к поис­ку тех­но­ло­ги­че­ско­го реше­ния, кото­рое помог­ло бы иден­ти­фи­ци­ро­вать и най­ти ребен­ка. Увы, но в тот момент все их уси­лия не при­нес­ли резуль­та­тов.

Девоч­ку нашли в 2018 году, спу­стя пять лет после выгруз­ки видео в Сеть. И тех­но­ло­гии тут были ни при чем. Сле­до­ва­тель смог выде­лить два пред­ме­та, кото­рые фигу­ри­ро­ва­ли на зад­нем фоне видео. Далее нача­лась кро­пот­ли­вая рабо­та по суже­нию мест поис­ка.

Выде­ля­лись фаб­ри­ки по про­из­вод­ству заме­чен­ных на видео вещей, точ­ки про­да­жи, и в кон­це кон­цов место поис­ка сузи­лось до одно­го рай­о­на. Поиск вещей пере­шел в соци­аль­ные сети. В резуль­та­те одна из вещиц была обна­ру­же­на на фото жен­щи­ны в Фейс­бу­ке, кото­рая ока­за­лась мате­рью девоч­ки. Сле­до­ва­те­ли вышли на адрес и спас­ли девоч­ку из рук ее отчи­ма, кото­рый в тече­ние все­го это­го вре­ме­ни совер­шал акты наси­лия над ребен­ком.

Каза­лось бы, машин­ное обу­че­ние (ML), искус­ствен­ный интел­лект (AI), рас­по­зна­ва­ние лиц, Интер­нет вещей (IoT) – все эти тех­но­ло­ги­че­ские реше­ния долж­ны были уско­рить про­цесс поис­ка и облег­чить зада­чу сле­до­ва­те­лям. Но все ока­за­лось слож­нее.

Спа­се­ние детей чаще все­го про­ис­хо­дит на сты­ке тех­но­ло­гий и пра­ва. Тем не менее есть хоро­шие ново­сти: тех­но­ло­ги­че­ские брен­ды сотруд­ни­ча­ют с пра­во­охра­ни­тель­ны­ми орга­на­ми, и сов­мест­но они улуч­ша­ют при­ме­не­ние новых тех­но­ло­гий, таких как авто­ма­ти­за­ция рас­по­зна­ва­ния лиц, пред­ме­тов, окру­же­ния.

Эта тех­но­ло­гия может выве­сти поиск детей и борь­бу с наси­ли­ем в режим реаль­но­го вре­ме­ни. Давай­те рас­смот­рим, как тех­но­ло­ги­че­ские брен­ды созда­ют про­дук­ты и сер­ви­сы на осно­ве ML для реше­ния слож­ных задач поис­ка. А затем пого­во­рим о том, чем вы може­те помочь в этом деле.

Для успеш­но­го и быст­ро­го поис­ка нам тре­бу­ют­ся инстру­мен­ты сопо­став­ле­ния изоб­ра­же­ний. 500 изоб­ра­же­ний с акта­ми сек­су­аль­но­го наси­лия над детьми загру­жа­ют­ся в Сеть каж­дую мину­ту. И хуже все­го то, что этот про­цесс труд­но оста­но­вить. Те, кто загру­жа­ет подоб­ные фото, зна­ют, что даже незна­чи­тель­ные мани­пу­ля­ции с изоб­ра­же­ни­ем созда­ют про­бле­мы для отсле­жи­ва­ния и иден­ти­фи­ка­ции жерт­вы. Доста­точ­но доба­вить на фото допол­ни­тель­ный зна­чок, изме­нить раз­мер – и фото рас­по­зна­ет­ся как новое, зано­сит­ся в базу как новое, созда­ет­ся новое дело по поис­ку жерт­вы. Рабо­та сле­до­ва­те­лей пре­вра­ща­ет­ся в нево­об­ра­зи­мый хаос и нераз­бе­ри­ху.

И до недав­не­го вре­ме­ни руч­ной ана­лиз изоб­ра­же­ний был един­ствен­ным спо­со­бом най­ти и отсле­дить людей, совер­шив­ших наси­лие над ребен­ком.

«Поиск насиль­ни­ка по фото­гра­фи­ям в этой огром­ной все­лен­ной Сети похож на поиск игол­ки в сто­ге сена», – гово­рит Корт­ни Гре­гу­ар, стар­ший юрист Microsoft Digital Crimes Unit.

Что­бы решить эту про­бле­му, Microsoft раз­ра­бо­та­ла инстру­мент под назва­ни­ем PhotoDNA. Этот бес­плат­ный инстру­мент может ана­ли­зи­ро­вать сним­ки (hash-matching technology), созда­вая базу изоб­ра­же­ний со сце­на­ми наси­лия. После того как сни­мок про­ска­ни­ро­ван, не важ­но, каким изме­не­ни­ям он под­верг­нет­ся, его копии будут рас­по­зна­ны и уда­ле­ны в режи­ме реаль­но­го вре­ме­ни, дан­ные о пере­дви­же­нии сним­ка по Сети ста­нут доступ­ны пра­во­охра­ни­тель­ным орга­нам.

Таким обра­зом, создан инстру­мент, кото­рый может не толь­ко быст­ро опре­де­лить новые сним­ки с акта­ми наси­лия над детьми, кото­рые были загру­же­ны недав­но, но и отобрать дуб­ли­ка­ты, что­бы облег­чить рабо­ту по поис­ку жерт­вы и насиль­ни­ка.

Как работает PhotoDNA

  • Инстру­мент с помо­щью поль­зо­ва­те­лей ска­ни­ру­ет Сеть и нахо­дит фото­гра­фии и видео со сце­на­ми наси­лия.
  • Про­грам­ма ана­ли­зи­ру­ет изоб­ра­же­ние, созда­ет циф­ро­вой код (hash) и загру­жа­ет фото в базу дан­ных.
  • Про­грам­ма ска­ни­ру­ет сер­ви­сы, кото­рые согла­си­лись на уча­стие в про­ек­те, на пред­мет нали­чия схо­жих фото (Facebook, Google).
  • В слу­чае если кто-то загру­жа­ет в Сеть сни­мок с акта­ми наси­лия, кото­ро­го нет в базе, PhotoDNA созда­ет циф­ро­вой код (hash), а сам сни­мок ухо­дит в пра­во­охра­ни­тель­ные орга­ны.

Что­бы при­влечь к рабо­те с базой дан­ных как мож­но боль­ше спе­ци­а­ли­зи­ро­ван­ных орга­ни­за­ций, Microsoft выгру­зи­ла PhotoDNA в обла­ко. Это озна­ча­ет, что боль­ше орга­ни­за­ций могут сопо­став­лять и отсле­жи­вать изоб­ра­же­ния жесто­ко­го обра­ще­ния с детьми. К про­ек­ту при­со­еди­ни­лись более 70 ком­па­ний и орга­ни­за­ций, сре­ди них Фейс­бук и Google.

В 2012 году ком­па­ния Microsoft заклю­чи­ла согла­ше­ние о сотруд­ни­че­стве с ком­па­ни­ей Thorn. Это ста­ло малень­кой рево­лю­ци­ей в сфе­ре борь­бы с наси­ли­ем над детьми. Обе ком­па­нии объ­еди­ни­ли уси­лия и созда­ли плат­фор­му для сбо­ра и сво­бод­но­го рас­про­стра­не­ния фото­гра­фий, поме­чен­ных про­грам­мой PhotoDNA. Такие циф­ро­вые мет­ки полу­чи­ли назва­ние – хэш (hash)

До 2012 года фото или видео со сце­ной наси­лия мог­ло попасть в базу дан­ных пра­во­охра­ни­тель­ных орга­нов раз­ны­ми путя­ми в бес­ко­неч­ном коли­че­стве сво­их копий. Дело в том, что до созда­ния про­ек­та Thorn каж­дый фото- и поис­ко­вый сер­вис само­сто­я­тель­но выис­ки­вал у себя сним­ки с кон­тен­том наси­лия, сам поме­чал, сам отправ­лял в базу. В резуль­та­те сле­до­ва­те­ли не мог­ли по полу­чен­ным сним­кам понять, новое ли это дело, или по это­му ребен­ку уже идет розыск. В базе дан­ных и в делах обра­зо­вал­ся нево­об­ра­зи­мый хаос.

Дошло до того, что помощь и поиск жертв при­шлось отло­жить, что­бы разо­брать­ся и очи­стить базу от дуб­ли­ка­тов, кото­рые дела­ли рабо­ту сле­до­ва­те­лей хао­тич­ной и бес­си­стем­ной.

Но дело пошло. Thorn’s Industry Hash Sharing Platform – это пер­вая ини­ци­а­ти­ва, кото­рая поз­во­ля­ет участ­ву­ю­щим орга­ни­за­ци­ям рабо­тать вме­сте, что­бы оста­но­вить наси­лие и тор­гов­лю детьми. Была созда­на цен­тра­ли­зо­ван­ная база дан­ных обме­на хэшей. Ком­па­нии парт­не­ры могут исполь­зо­вать хэши, уже иден­ти­фи­ци­ро­ван­ные дру­ги­ми сер­ви­са­ми через PhotoDNA Cloud. Исполь­зуя общую базу дан­ных, они про­во­дят ска­ни­ро­ва­ние сво­их плат­форм.

Если при ска­ни­ро­ва­нии сер­вис обна­ру­жи­ва­ет ранее зане­сен­ное в базу изоб­ра­же­ние, он отсле­жи­ва­ет его пере­ме­ще­ние и, сле­до­ва­тель­но, помо­га­ет в поис­ках. Но если отска­ни­ро­ван­ные изоб­ра­же­ния еще не были хэши­ро­ва­ны, PhotoDNA Cloud сооб­ща­ет о них, как о появ­ле­нии новой жерт­вы.

Резуль­тат: мгно­вен­ное рас­по­зна­ва­ние изоб­ра­же­ний, кото­рые не были зане­се­ны в базу, а зна­чит могут быть фак­та­ми ново­го акта наси­лия над ребен­ком. Это зна­чи­тель­но сокра­ща­ет срок от момен­та иден­ти­фи­ка­ции до откры­тия дела и поис­ка ребен­ка. Сей­час нашей геро­ине, с исто­рии кото­рой мы нача­ли эту ста­тью, не при­шлось бы ждать два года, преж­де чем нача­лись ее поис­ки.

Резуль­та­том парт­нер­ства Thorn-Microsoft ста­ло то, что девять круп­ней­ших фото­бан­ков США и такие ком­па­нии, как Фейс­бук и Google, при­со­еди­ни­лись к про­ек­ту. Они исполь­зу­ют более 90 000 хэш-фай­лов для иден­ти­фи­ка­ции кон­тен­та с акта­ми наси­лия над детьми и попол­ня­ют базу дан­ных сво­и­ми наход­ка­ми.

Но есть еще кое-что…

Мож­но най­ти ребен­ка и без фото само­го ребен­ка. Доста­точ­но при­смот­реть­ся к окру­же­нию и зад­не­му фону на фото или видео. В нашей исто­рии сле­до­ва­те­ли исполь­зо­ва­ли вещи, кото­рые они заме­ти­ли на видео. Но про­цесс поис­ка по этим ули­кам был дол­гим и тру­до­ем­ким.

Но и здесь ситу­а­ция нача­ла менять­ся. Сер­вис TraffickCam – пер­вый шаг в авто­ма­ти­за­ции про­цес­са опре­де­ле­ния места пре­ступ­ле­ния в режи­ме реаль­но­го вре­ме­ни. Если наси­лие про­изо­шло в оте­ле, сер­вис помо­жет опре­де­лить место­по­ло­же­ние оте­ля. Для это­го он срав­ни­ва­ет эле­мен­ты инте­рье­ра, кото­рые попа­ли на видео или фото, с фото­гра­фи­я­ми номе­ров оте­лей в сво­ей базе.

Как работает TraffickCam

  • Сер­вис про­сит поль­зо­ва­те­лей делать сним­ки номе­ров оте­лей, в кото­рых они оста­нав­ли­ва­ют­ся.
  • Поль­зо­ва­те­ли загру­жа­ют сним­ки в базу дан­ных.
  • Сер­вис срав­ни­ва­ет фото с места пре­ступ­ле­ния с фото в сво­ей базе дан­ных и выда­ет резуль­та­ты.

Дан­ное реше­ние не иде­аль­но, но оно пер­спек­тив­но. Со вре­ме­нем база дан­ных рас­ши­рит­ся, а алго­рит­мы рас­по­зна­ва­ния ста­нут более быст­ры­ми и точ­ны­ми.

Отска­ни­ро­вать каж­до­го ребен­ка – такое тех­но­ло­ги­че­ское реше­ние уже пред­ла­га­ет­ся, и вско­ре каж­до­му роди­те­лю надо будет решить, зано­сить ли сво­их детей в базу дан­ных на слу­чай похи­ще­ния и розыс­ка.

Новые тех­но­ло­гии ска­ни­ро­ва­ния радуж­ки гла­за поз­во­лят осу­ществ­лять поиск детей в режи­ме реаль­но­го вре­ме­ни. Дирек­тор Цен­тра био­мет­ри­че­ских иссле­до­ва­ний Cylan University в Уни­вер­си­те­те Кар­не­ги-Мел­ло­на Мариос Сав­ви­дас как раз рабо­та­ет над такой тех­но­ло­ги­ей.

«Сей­час пра­во­охра­ни­тель­ные орга­ны име­ют толь­ко фото­гра­фии про­пав­ших без вести детей, но внеш­ность может изме­нить­ся. Дети взрос­ле­ют, они меня­ют­ся. Радуж­ная же обо­лоч­ка гла­за оста­ет­ся без изме­не­ний на про­тя­же­нии всей жиз­ни. Наш ска­нер помо­жет полу­чить дан­ные, кото­рые зна­чи­тель­но уско­рят поиск», – ска­зал Сав­ви­дас.

Для ска­ни­ро­ва­ния обо­лоч­ки гла­за тре­бу­ет­ся три секун­ды. После это­го вся инфор­ма­ция о ребен­ке зано­сит­ся в базу дан­ных. У это­го спо­со­ба есть зна­чи­тель­ные пре­иму­ще­ства в срав­не­нии с при­ня­тым сей­час мето­дом иден­ти­фи­ка­ции с помо­щью отпе­чат­ка паль­ца. Радуж­ку, по утвер­жде­ни­ям раз­ра­бот­чи­ков, мож­но будет «про­честь» с рас­сто­я­ния в 30 мет­ров даже через машин­ное стек­ло.

Идея созда­те­лей тех­но­ло­гии заклю­ча­ет­ся в том, что­бы уста­но­вить ска­не­ры в аэро­пор­тах и кон­троль­но-про­пуск­ных пунк­тах на гра­ни­це. Но для поис­ка похи­щен­но­го ребен­ка его дан­ные спер­ва надо будет зане­сти в базу. То есть роди­те­лям будет пред­ло­же­но доб­ро­воль­но отска­ни­ро­вать радуж­ную обо­лоч­ку гла­за сво­е­го ребен­ка и поме­стить ее в базу дан­ных на слу­чай похи­ще­ния.

А теперь ваш выход. Вы може­те стать частью этой борь­бы с наси­ли­ем над детьми. Новые циф­ро­вые инстру­мен­ты иден­ти­фи­ка­ции жертв наси­лия и их поиск не озна­ча­ют окон­ча­ние тако­го явле­ния, как наси­лие или похи­ще­ние ребен­ка. Но они, без сомне­ния, улуч­ша­ют и уско­ря­ют про­цесс иден­ти­фи­ка­ции и поис­ка жертв и насиль­ни­ков. Чем боль­ше дан­ных мы собе­рем, тем быст­рее будет про­хо­дить про­цесс поис­ка.

Неза­ви­си­мо от того, явля­е­тесь ли вы орга­ни­за­ци­ей или част­ным лицом, вы може­те при­нять уча­стие в созда­нии базы дан­ных для уско­ре­ния про­цес­са рабо­ты про­грамм искус­ствен­но­го интел­лек­та.

Если вы пред­став­ля­е­те орга­ни­за­цию с плат­фор­мой для обме­на фото­гра­фи­я­ми и гото­вы при­со­еди­нить­ся к дви­же­нию, напи­ши­те в Thorn [email protected].

Если вы поль­зо­ва­тель, ска­чай­те при­ло­же­ние TraffickCam и каж­дый раз, когда оста­но­ви­тесь в оте­ле, сфо­то­гра­фи­руй­те свой номер. Так мы сов­мест­но будем попол­нять базу дан­ных, кото­рая помо­жет ML, AI, IoT делать свое дело быст­ро и точ­но.

Ста­тья под­го­тов­ле­на на осно­ве мате­ри­а­лов сай­та towardsdatascience.com