Алгоритмы MIT и краудсорсинг: определение исчезающих животных

patterns
Иссле­до­ва­те­ли из Мас­са­чу­сет­ско­го тех­но­ло­ги­че­ско­го инсти­ту­та созда­ли алго­ритм рас­по­зна­ва­ния повто­ря­ю­щих­ся шаб­ло­нов, кото­рый, сов­мест­но с кра­уд­сор­син­гом, может зна­чи­тель­но упро­стить рабо­ту с изоб­ра­же­ни­я­ми исче­за­ю­щих живот­ных.

Бла­го­да­ря объ­еди­не­нию кра­ду­сор­син­га и новых алго­рит­мов рас­по­зна­ва­ния повто­ря­ю­щих­ся шаб­ло­нов ста­ло воз­мож­но иден­ти­фи­ци­ро­вать отдель­ных живот­ных в нахо­дя­щих­ся под угро­зой исчез­но­ве­ния попу­ля­ци­ях, как сооб­щи­ли иссле­до­ва­те­ли из Мас­са­чу­сет­ско­го тех­но­ло­ги­че­ско­го инсти­ту­та (MIT).

Эко­ло­ги, как пра­ви­ло, ста­вят на живот­ное мет­ку, отпус­ка­ют его на волю и сле­дят за его даль­ней­шим пере­ме­ще­ни­ем, в том чис­ле фото­гра­фи­руя живот­ное в его есте­ствен­ной сре­де оби­та­ния и ката­ло­ги­зи­руя полу­чен­ные изоб­ра­же­ния вме­сте с такой инфор­ма­ци­ей, как раз­мер живот­но­го и его гео­гра­фи­че­ская лока­ция.

Но, по мере накоп­ле­ния боль­шо­го коли­че­ства изоб­ра­же­ний, их про­смотр и опре­де­ле­ние живот­но­го на фото­гра­фии ста­но­вит­ся очень тяже­лой рабо­той.

Сай Раве­ла (Sai Ravela), глав­ный науч­ный сотруд­ник отде­ла Зем­ли, атмо­сфе­ры и пла­не­тар­ных наук в Мас­са­чу­сет­ском тех­но­ло­ги­че­ском инсти­ту­те, счи­та­ет, что руч­ной поиск через ката­лог из 10 000 сним­ков может занять у одно­го чело­ве­ка 15 лет.

Для того, что­бы решить эту про­бле­му, уче­ные раз­ра­бо­та­ли про­грамм­ное обес­пе­че­ние, кото­рое авто­ма­ти­зи­ру­ет боль­шую часть это­го про­цес­са.

Систе­ма, полу­чив­шая назва­ние SLOOP, осу­ществ­ля­ет поиск по базе изоб­ра­же­ний, исполь­зуя алго­рит­мы рас­по­зна­ва­ния повто­ря­ю­щих­ся шаб­ло­нов для ана­ли­за таких черт живот­но­го, как полос­ки или пят­на, на каж­дом изоб­ра­же­нии. Затем систе­ма опре­де­ля­ет око­ло 20 наи­бо­лее веро­ят­ных сов­па­де­ний для живот­но­го. К это­му иссле­до­ва­те­ли затем добав­ля­ют всю силу кра­уд­сор­син­га, про­ся поль­зо­ва­те­лей выби­рать наи­бо­лее похо­жие пары. С помо­щью этой инфор­ма­ции систе­ма пере­фор­ми­ру­ет спи­сок, сво­дя его к мень­ше­му коли­че­ству изоб­ра­же­ний и остав­ляя толь­ко те, на кото­рых с наи­боль­шей веро­ят­но­стью изоб­ра­же­но дан­ное живот­ное.

Для того, что­бы оце­нить потен­ци­ал кра­уд­сор­син­га, коман­да Раве­лы опуб­ли­ко­ва­ла тыся­чи фото­гра­фий сала­мандр – в груп­пах по четы­ре – на плат­ном кра­уд­сор­син­го­вом ресур­се Mechanical Turk. Иссле­до­ва­те­ли попро­си­ли поль­зо­ва­те­лей клас­си­фи­ци­ро­вать похо­жие изоб­ра­же­ния. Что­бы оце­нить спо­соб­ность поль­зо­ва­те­лей рас­по­зна­вать изоб­ра­же­ния, систе­ма была запро­грам­ми­ро­ва­на таким обра­зом, что зна­ла пра­виль­ные вари­ан­ты в трех из четы­рех слу­ча­ях. Если поль­зо­ва­тель пра­виль­но клас­си­фи­ци­ро­вал изоб­ра­же­ния в этих слу­ча­ях, то систе­ма при­ни­ма­ла его чет­вер­тый ответ. Треть поль­зо­ва­те­лей про­яви­ли очень хоро­шие спо­соб­но­сти в сопо­став­ле­нии повто­ря­ю­щих­ся шаб­ло­нов.

Объ­еди­няя ком­пью­тер­ные алго­рит­мы с кра­уд­сор­син­гом, иссле­до­ва­те­ли смог­ли быст­ро иден­ти­фи­ци­ро­вать соот­вет­ствия сре­ди тысяч фото­гра­фий с точ­но­стью 97%.

Сей­час коман­да рабо­та­ет над даль­ней­шей авто­ма­ти­за­ци­ей систе­мы и раз­ра­бот­кой алго­рит­мов, кото­рые смо­гут отде­лять живот­ное от фоно­во­го изоб­ра­же­ния. Это слож­ная зада­ча, посколь­ку систе­ма долж­на будет отли­чить, напри­мер, ногу яще­ри­цы от сосед­ней вет­ки. Что­бы решить эти про­бле­мы, коман­да раз­ра­ба­ты­ва­ет алго­рит­мы рас­по­зна­ва­ния с помо­щью гео­мет­рии и объ­еди­не­ния алго­рит­мов рас­по­зна­ва­ния пове­де­ния.

Раве­ла с кол­ле­га­ми в насто­я­щее вре­мя при­ме­ня­ет систе­му для рабо­ты с исче­за­ю­щи­ми и нахо­дя­щи­ми­ся под угро­зой исчез­но­ве­ния вида­ми, в том чис­ле гек­ко­на­ми, кито­вы­ми аку­ла­ми и сцин­ка­ми, и в июне пред­ста­вит свою рабо­ту на кон­фе­рен­ции по рас­по­зна­ва­нию шаб­ло­нов пове­де­ния в Мек­си­ке.