Журналистика данных: инновация или пустая трата времени и сил?

Основное отличие журналистики данных от обычных статей в том, что данные помещены в самое сердце материала. Инфографика, интерактивные карты, хронологические графики, круговые диаграммы, вокруг которых выстроена вся журналистская история, – это продукты журналистики данных. Фото: фрагмент проекта Who Old Are You? informationisbeautiful.net/visualizations/who-old-are-you
Основное отличие журналистики данных от обычных статей в том, что данные помещены в самое сердце материала. Инфографика, интерактивные карты, хронологические графики, круговые диаграммы, вокруг которых выстроена вся журналистская история, – это продукты журналистики данных. Фото: фрагмент проекта Who Old Are You? informationisbeautiful.net/visualizations/who-old-are-you

Жур­на­ли­сти­ка дан­ных на сего­дня один из самых инно­ва­ци­он­ных видов жур­на­ли­сти­ки, осно­ван­ный на обра­бот­ке, интер­пре­та­ции и визу­а­ли­за­ции боль­ших объ­е­мов инфор­ма­ции.

Жур­на­ли­сты рабо­та­ли со ста­ти­сти­кой и дру­ги­ми мас­си­ва­ми дан­ных на про­тя­же­нии все­го суще­ство­ва­ния про­фес­сии. Как пишет Сай­мон Род­жерс, один из гуру совре­мен­ной дата-жур­на­ли­сти­ки и осно­ва­тель Datablog для Guardian, вся спор­тив­ная жур­на­ли­сти­ка, финан­со­вая ана­ли­ти­ка, даже про­гно­зы пого­ды стро­ят­ся на обра­бот­ке такой инфор­ма­ции.

Основ­ное отли­чие жур­на­ли­сти­ки дан­ных от обыч­ных ста­тей в том, что дан­ные поме­ще­ны в самое серд­це мате­ри­а­ла. Инфо­гра­фи­ка, интер­ак­тив­ные кар­ты, хро­но­ло­ги­че­ские гра­фи­ки, кру­го­вые диа­грам­мы, вокруг кото­рых выстро­е­на вся жур­на­лист­ская исто­рия, – это про­дук­ты жур­на­ли­сти­ки дан­ных.

Офи­ци­аль­но это направ­ле­ние офор­ми­лось в неза­ви­си­мый жанр отно­си­тель­но недав­но – сам тер­мин был пред­ло­жен в 2010 году. Но отве­ча­ю­щие фор­ма­ту мате­ри­а­лы мож­но отыс­кать и в архи­вах. Этот этап в дата-жур­на­ли­сти­ке даже назы­ва­ют вик­то­ри­ан­ским.

Начало

Жур­на­лист Фло­ренс Най­тин­гейл боро­лась за улуч­ше­ние усло­вий в бри­тан­ской армии. Она про­ве­ла обшир­ную рабо­ту, ана­ли­зи­руя смерт­ность в вой­сках, и уста­но­ви­ла, а потом дока­за­ла бри­тан­ско­му пар­ла­мен­ту, что в боль­шин­стве слу­ча­ев сол­да­ты гиб­ли по при­чи­нам, кото­рые мож­но было предот­вра­тить, напри­мер, вслед­ствие анти­са­ни­та­рии.

Ее отчет, опуб­ли­ко­ван­ный в 1858 году, пест­рил гра­фи­ка­ми, диа­грам­ма­ми, и дата-жур­на­ли­сты уве­рен­но при­чис­ля­ют ее к пио­не­рам направ­ле­ния.

Бри­тан­ская Guardian наста­и­ва­ет, что один из пер­вых резо­нанс­ных мате­ри­а­лов в сти­ле жур­на­ли­сти­ки дан­ных был опуб­ли­ко­ван в ее пилот­ном номе­ре, вышед­шем в 1891 году.

Этот выпуск газе­ты вклю­чал таб­ли­цу, полу­чен­ную из ано­ним­но­го источ­ни­ка. Она содер­жа­ла спи­сок школ в Ман­че­сте­ре и Сал­фор­де, чис­ло уча­щих­ся и годо­вые затра­ты госу­дар­ства на обра­зо­ва­ние.

В резуль­та­те ана­ли­за этих дан­ных Guradian смог­ла выявить круп­ные рас­хож­де­ния с офи­ци­аль­ной ста­ти­сти­кой и более точ­но уста­но­вить, сколь­ко детей полу­ча­ли бес­плат­ное обра­зо­ва­ние и како­ва была доля школь­ни­ков из бед­ных семей.

Еще более ран­няя пуб­ли­ка­ция New York Tribune от 1849 года счи­та­ет­ся одним из слу­ча­ев пер­во­го исполь­зо­ва­ния инфо­гра­фи­ки.

В этом мате­ри­а­ле газе­та визу­аль­но отоб­ра­зи­ла дан­ные о вспыш­ке холе­ры, при­ве­зен­ной на кораб­ле из Евро­пы. С помо­щью гра­фи­ка был сде­лан печаль­ный и оправ­дав­ший­ся про­гноз о том, что пик эпи­де­мии Нью-Йор­ку на тот момент еще толь­ко пред­сто­ял.

Рабо­та бри­тан­ско­го вра­ча Джо­на Сноу, опуб­ли­ко­ван­ная в 1854 году, – при­мер кар­ти­ро­ва­ния, мето­да, широ­ко при­ме­ня­е­мо­го дата-жур­на­ли­ста­ми и сего­дня.

В мире, еще не знав­шем о суще­ство­ва­нии мик­ро­бов, Сноу заре­ги­стри­ро­вал и нанес на кар­ту слу­чаи зара­же­ния холе­рой во вре­мя вспыш­ки болез­ни в Лон­доне. Эта визу­а­ли­за­ция поз­во­ли­ла ему запо­до­зрить связь меж­ду эпи­де­ми­ей и насос­ной стан­ци­ей, вокруг кото­рой про­жи­ва­ли забо­лев­шие. В резуль­та­те было уста­нов­ле­но, что в эту сек­цию город­ско­го водо­снаб­же­ния попа­да­ли зара­жен­ные кана­ли­за­ци­он­ные воды.

Но ста­нов­ле­ние жур­на­ли­сти­ки дан­ных как пол­но­цен­но­го направ­ле­ния ста­ло воз­мож­но веком поз­же – на волне циф­ро­вой рево­лю­ции и тира­жи­ро­ва­ния идей доступ­но­сти инфор­ма­ции: откры­тых дан­ных, элек­трон­ных пра­ви­тельств, рас­про­стра­не­ния опен­сорс­ных реше­ний для обра­бот­ки и визу­а­ли­за­ции, а так­же воз­ник­но­ве­ния бигда­ты.

Новое рождение

Совре­мен­ная жур­на­ли­сти­ка дан­ных мно­гим обя­за­на жур­на­лист­ско­му репор­та­жу с при­ме­не­ни­ем ком­пью­тер­ных тех­но­ло­гий, или CAR (computer-assisted reporting).

Этот тренд воз­ник в ран­нюю ста­дию ком­пью­тер­ной эры, когда репор­те­ры нача­ли экс­пе­ри­мен­ти­ро­вать с вычис­ли­тель­ны­ми маши­на­ми для обра­бот­ки инфор­ма­ции. Так, в 1952 году CBS исполь­зо­вал ком­пью­тер­ные алго­рит­мы для пред­ска­за­ния исхо­да пре­зи­дент­ских выбо­ров в США и абсо­лют­ной побе­ды Эйзен­хау­э­ра с точ­но­стью до одно­го про­цен­та.

Филипп Мей­ер и Эллиот Яспен счи­та­ют­ся отца­ми-осно­ва­те­ля­ми жур­на­ли­сти­ки дан­ных. Мей­ер – автор тер­ми­на «жур­на­ли­сти­ка точ­но­сти», кото­рый он пред­ло­жил в сво­ей кни­ге с одно­имен­ным назва­ни­ем.

В ней он рато­вал за исполь­зо­ва­ние науч­ных мето­дов ана­ли­за дан­ных в жур­на­ли­сти­ке рас­сле­до­ва­ний. Мей­ер при­ме­нил ста­ти­сти­че­ский ана­лиз для выяс­не­ния при­чин бун­тов в Дет­рой­те в 1967 году для газе­ты Detroit Free Press. Про­ана­ли­зи­ро­вав дан­ные, он смог раз­ве­ять несколь­ко попу­ляр­ных в обще­стве мифов о соста­ве бун­тов­щи­ков и их моти­вах.

В 1980-х годах в США в жан­ре жур­на­ли­сти­ки дан­ных рабо­та­ли уже десят­ки жур­на­ли­стов. А в 1989 году CAR впер­вые полу­чи­ла высо­чай­шее при­зна­ние в про­фес­си­о­наль­ной сре­де: жур­нал Atlanta Journal-Constitution был удо­сто­ен Пулит­це­ров­ской пре­мии за серию мате­ри­а­лов о расо­вом нера­вен­стве, кото­рое было выяв­ле­но при ана­ли­зе поли­ти­ки бан­ков по выда­че ипо­теч­ных зай­мов.

В том же году Эллиот Яспен, еще один ярый сто­рон­ник CAR и лау­ре­ат Пулит­це­ров­ской пре­мии, спо­соб­ство­вал пре­вра­ще­нию жур­на­ли­сти­ки дан­ных в ака­де­ми­че­скую дис­ци­пли­ну. Он осно­вал в Мис­су­ри Наци­о­наль­ный инсти­тут жур­на­лист­ско­го репор­та­жа с при­ме­не­ни­ем ком­пью­тер­ных тех­но­ло­гий National Institute for Computer-Assisted Reporting (NICAR).

В пер­вое деся­ти­ле­тие XXI века свои дата-бло­ги вела боль­шая часть тита­нов запад­но­го медиа­рын­ка: Guradian с Datablog, The Upshot газе­ты New York Times, блог Data Desk изда­ния Los Angeles Times, Washington Post и мно­гие дру­гие. К про­дви­же­нию жур­на­ли­сти­ки дан­ных так­же актив­но под­клю­чи­лись круп­ней­шие ассо­ци­а­ции жур­на­ли­стов-рас­сле­до­ва­те­лей: от Investigative Reporters and Editors до Global Investigative Journalism Network.

Еще один мощ­ный тол­чок в новой эре жур­на­ли­сти­ка дан­ных полу­чи­ла от WikiLeaks и Эдвард Сно­уден, предо­ста­вив­ших ряду СМИ экс­клю­зив­ный доступ к десят­кам тысяч сырых сек­рет­ных фай­лов о вой­нах в Ира­ке и Афга­ни­стане.

Сайт конкурса Data Journalism Awards.
Сайт кон­кур­са Data Journalism Awards.

Обра­бот­кой этих огром­ных архи­вов зани­ма­лись, в част­но­сти, Spiegel, Guardian и Associated Press. В 2012 году была осно­ва­на пре­мия Data Journalism Awards для выда­ю­щих­ся дости­же­ний в сфе­ре жур­на­ли­сти­ки дан­ных.

Журналистика данных сегодня

Совре­мен­ная жур­на­ли­сти­ка дан­ных – это сот­ни мате­ри­а­лов и инстру­мен­тов, еже­днев­но пуб­ли­ку­е­мых по все­му миру. По сло­жив­ше­му­ся убеж­де­нию, она ста­ла не толь­ко дети­щем захлест­нув­ше­го мир тех­но­ло­ги­че­ско­го пере­во­ро­та, но и реак­ци­ей медиа­сфе­ры на повсе­мест­но воца­рив­шу­ю­ся собы­тий­ную жур­на­ли­сти­ку, живу­щую за счет ско­ро­сти пода­чи инфор­ма­ции и сен­са­ци­он­но­сти.

В про­ти­во­вес ей жур­на­ли­сти­ка дан­ных скру­пу­лез­на, заин­те­ре­со­ва­на в дета­лях, а в фор­му­ле «пяти W» глав­ным обра­зом сосре­до­то­че­на на вопро­се «Поче­му?».

Одна из основ­ных ее целей – про­дви­нуть чита­те­ля чуть даль­ше в пони­ма­нии не толь­ко собы­тия, но и его кон­тек­ста, и под­ве­сти базу под изо­ли­ро­ван­ные про­ис­ше­ствия и раз­роз­нен­ные фак­ты.

Как, напри­мер, про­шло­год­ний мас­штаб­ный про­ект немец­кой Berliner Morgenpost. В сво­ем мате­ри­а­ле Es war nicht immer der Osten газе­та про­сле­ди­ла дина­ми­ку рас­пре­де­ле­ния голо­сов на выбо­рах в каж­дой из немец­ких земель с 1990 года.

Газе­те уда­лось про­де­мон­стри­ро­вать, что при­ход в немец­кий пар­ла­мент крайне пра­вых впер­вые за пол­ве­ка был отнюдь не таким сюр­при­зом, как каза­лось.

Дру­гой извест­ный дата-про­ект Gapminder стре­мит­ся повли­ять на наше вос­при­я­тие поло­же­ния дел в целом на пла­не­те.

Его созда­те­ли счи­та­ют, что мы совер­шен­но непра­виль­но вос­при­ни­ма­ем мир, и пыта­ют­ся дока­зать это с помо­щью дан­ных. Для нача­ла посе­ти­те­лям пред­ла­га­ет­ся прой­ти тест на зна­ние основ­ной гло­баль­ной ста­ти­сти­ки, кото­рый, по мне­нию авто­ров, вы непре­мен­но про­ва­ли­те.

Поиск при­чин­но-след­ствен­ных свя­зей, новых ракур­сов – еще одна клю­че­вая зада­ча, над реше­ни­ем кото­рой бьет­ся жур­на­ли­сти­ка дан­ных. Агент­ство Bloomberg извест­но сво­ей высо­ко­ка­че­ствен­ной инфо­гра­фи­кой, в част­но­сти про­ек­том «Самые смер­то­нос­ные про­фес­сии в Аме­ри­ке».

Соглас­но выво­дам в этом мате­ри­а­ле, мусор­щи­ки в США стал­ки­ва­ют­ся с более высо­ким риском лишить­ся жиз­ни, выпол­няя свою рабо­ту, чем пожар­ные, а аме­ри­кан­ские так­си­сты чаще поги­ба­ют насиль­ствен­ной смер­тью, чем поли­цей­ские.

Воз­мож­ность обна­ру­жить скры­тые зако­но­мер­но­сти через ана­лиз сухих дан­ных сде­лал этот жанр осо­бен­но попу­ляр­ным у жур­на­ли­стов-рас­сле­до­ва­те­лей. Стив Дой в 1993 году про­ана­ли­зи­ро­вал ущерб, нане­сен­ный ура­га­ном Энд­рю в США.

Он объ­еди­нил два пото­ка дан­ных: кар­ту раз­ру­ше­ний и ско­рость вет­ра. Это поз­во­ли­ло ему уста­но­вить обла­сти, где послед­ствия ока­за­лись мас­штаб­ны­ми еще и пото­му, что в этих рай­о­нах дей­ство­ва­ли менее стро­гие тре­бо­ва­ния к каче­ству построй­ки. За свое рас­сле­до­ва­ние Дой был удо­сто­ен Пулит­це­ров­ской пре­мии.

В 2015 году Al Jazeera America про­ана­ли­зи­ро­ва­ла дви­же­ние сошед­ше­го с рель­сов поез­да и уста­но­ви­ла, что этот кон­крет­ный состав на про­тя­же­нии меся­цев до ката­стро­фы вхо­дил в опас­ный вираж на повы­шен­ной ско­ро­сти.

В про­шлом году канад­ская Globe and Mail обра­бо­та­ла инфор­ма­цию из 870 поли­цей­ских участ­ков. В резуль­та­те ей уда­лось уста­но­вить, что поли­ция отка­зы­ва­ет­ся рас­сле­до­вать одно из пяти заяв­ле­ний о пре­ступ­ле­ни­ях сек­су­аль­но­го харак­те­ра, клас­си­фи­ци­руя их как «не име­ю­щие осно­ва­ний».

Миссия журналистики данных

Дру­гая мис­сия жур­на­ли­сти­ки дан­ных – облег­че­ние досту­па к раз­роз­нен­ной, нечи­та­бель­ной, мало­до­ступ­ной инфор­ма­ции. Ино­гда мно­го­ме­сяч­ная рабо­та команд дата-жур­на­ли­стов, обра­бо­тав­ших тыся­чи стро­чек инфор­ма­ции или оциф­ро­вав­ших сот­ни доку­мен­тов в фор­ма­те pdf, завер­ша­ет­ся тем, что состав­лен­ная вычи­щен­ная и выве­рен­ная таб­ли­ца «про­сто» раз­ме­ща­ет­ся онлайн в чита­бель­ном фор­ма­те для все­об­ще­го поль­зо­ва­ния.

Эта мис­сия ока­зы­ва­ет­ся осо­бен­но важ­на в репрес­сив­ной сре­де, где доступ к надеж­ной коли­че­ствен­ной инфор­ма­ции закрыт или силь­но огра­ни­чен.

La Nacion Data соби­ра­ет, оциф­ро­вы­ва­ет и выкла­ды­ва­ет в общий доступ раз­но­об­раз­ную инфор­ма­цию об Арген­тине, стране, где отсут­ству­ет закон о сво­бо­де инфор­ма­ции.

Про­ект Excesos Sin Castigo пуб­ли­ку­ет дан­ные о добы­ва­ю­щей и неф­тя­ной отрас­лях Перу.

При этом несколь­ко плот­ных пара­гра­фов тек­ста может заме­нять одна резю­ми­ру­ю­щая инфо­гра­фи­ка.

Напри­мер, рабо­та дата-бло­га Information is beautiful о круп­ней­ших слу­ча­ях утеч­ки лич­ных дан­ных онлайн.

Или про­ект Guardian US о пра­вах ЛГБТ в США, или обнов­ля­ю­ща­я­ся в реаль­ном вре­ме­ни кар­та убийств жен­щин в Тур­ции.

Более того, жур­на­ли­сти­ка дан­ных дале­ко не все­гда сама серьез­ность. Резуль­та­том мно­го­ча­со­вой рабо­ты с циф­ра­ми может стать, напри­мер, рей­тинг самых глу­пых раз­бо­рок меж­ду редак­то­ра­ми Вики­пе­дии.

Что ждет журналистику данных?

В 2017 году Google News Lab опуб­ли­ко­ва­ла иссле­до­ва­ние, в кото­ром насто­я­щее жур­на­ли­сти­ки дан­ных пред­ста­ло доста­точ­но обна­де­жи­ва­ю­щим. Так, 42 про­цен­та жур­на­ли­стов сооб­щи­ли, что исполь­зу­ют в сво­ей рабо­те дан­ные, а в 51 про­цен­те слу­ча­ев в редак­ции рабо­та­ет спе­ци­а­лист по дата-жур­на­ли­сти­ке.

Но, по мне­нию мно­гих, жур­на­ли­сти­ка дан­ных раз­ви­ва­ет­ся не так стре­ми­тель­но, как пред­по­ла­га­лось: на игро­вом поле по-преж­не­му в основ­ном пред­став­ле­ны запад­ные СМИ, а в отдель­ных стра­нах жур­на­ли­сти­ка дан­ных отсут­ству­ет вовсе.

Более того, после пре­зи­дент­ских выбо­ров в США в 2016 году неко­то­рые поспе­ши­ли похо­ро­нить дата-жур­на­ли­сти­ку и в этой стране по той при­чине, что ни один авто­ри­тет­ный дата-источ­ник, от FiveThirtyEight до Politico, не смог пред­ска­зать исход это­го голо­со­ва­ния.

Жур­на­ли­сти­ка дан­ных как жанр дей­стви­тель­но стал­ки­ва­ет­ся с мас­сой труд­но­стей на каж­дом эта­пе про­из­вод­ства, в осо­бен­но­сти это каса­ет­ся чело­ве­че­ских ресур­сов.

По все­об­ще­му убеж­де­нию, поток рабо­ты над мате­ри­а­лом в жан­ре жур­на­ли­сти­ки дан­ных под­ра­зу­ме­ва­ет, что жур­на­лист раз­би­ра­ет­ся в мето­дах обра­бот­ки и ана­ли­за дан­ных, пони­ма­ет про­грам­ми­ро­ва­ние, гра­фи­че­ский дизайн и веб-раз­ра­бот­ку.

По сло­вам 53 про­цен­тов опро­шен­ных Google News Lab, боль­шин­ству нелег­ко дает­ся при­об­ре­те­ние тако­го спек­тра навы­ков. Для их осво­е­ния жур­на­ли­сту необ­хо­ди­мо потра­тить десят­ки, если не сот­ни часов.

В про­тив­ном слу­чае редак­ции необ­хо­ди­мо при­вле­кать целую коман­ду спе­ци­а­ли­стов, что сопря­же­но с серьез­ны­ми тра­та­ми, кото­рые быва­ют не по силам или не по нра­ву редак­ци­ям. По дан­ным Google News Lab, почти 40 про­цен­тов из них про­сто не видят отда­чи от таких вло­же­ний ресур­сов.

Как след­ствие, недо­ста­ток ква­ли­фи­ка­ции, опы­та и вла­де­ния науч­ны­ми мето­да­ми может при­во­дить к тому, что жур­на­лист допус­ка­ет ошиб­ки, выры­ва­ет дан­ные из кон­тек­ста или дела­ет поспеш­ные выво­ды.

Широ­ко изве­стен мате­ри­ал одно­го из веду­щих дата-бло­гов FiveThirtyEight о похи­ще­ни­ях людей в Ниге­рии (https://fivethirtyeight.com/features/mapping-kidnappings-in-nigeria/). Жур­на­лист собра­ла дан­ные о похи­ще­ни­ях из средств инфор­ма­ции, затем эти све­де­ния были нане­се­ны на кар­ту как фак­ти­че­ские похи­ще­ния, что при­ве­ло к пере­ко­су во всем рас­сле­до­ва­нии.

Еще 49 про­цен­тов опро­шен­ных Google News Lab в каче­стве пре­пят­ствия ука­зы­ва­ли на нехват­ку вре­ме­ни: мно­гим из них необ­хо­ди­мо сда­вать гото­вую рабо­ту в тече­ние дня, а это­го обыч­но недо­ста­точ­но для про­ве­де­ния пол­но­цен­но­го коли­че­ствен­но­го ана­ли­за и визу­а­ли­за­ции.

Гре­че­ская жур­на­лист­ка Эва Костан­та­рас объ­яс­ня­ет дефи­цит дата-жур­на­ли­стов и спе­ци­фи­кой кон­тек­ста в отдель­ных стра­нах, где жур­на­ли­сты при­выч­но рабо­та­ют с пресс-рели­за­ми: «В таких слу­ча­ях самое слож­ное – най­ти тех, кто готов оста­вить свою рабо­ту «сте­но­гра­фи­ста» и взять на себя роль постав­щи­ка зна­ний. И это неже­ла­ние не смо­гут устра­нить ни оби­лие дан­ных, ни нали­чие нуж­ных тех­но­ло­гий».

Веду­щие дата-жур­на­ли­сты пла­не­ты не соглас­ны ни с одним пес­си­ми­стич­ным про­гно­зом.

Сай­мон Род­жерс, дол­гое вре­мя кури­ро­вав­ший дата-блог Guardian, а сей­час воз­глав­ля­ю­щий Google News Lab, счи­та­ет, что жур­на­ли­сти­ка дан­ных сего­дня доступ­на, как нико­гда: «В мире, где есть мас­са кур­сов, источ­ни­ков, инстру­мен­тов для авто­ма­ти­за­ции сбо­ра дан­ных и созда­ния циф­ро­вой гра­фи­че­ской инфор­ма­ции быть дата-жур­на­ли­стом про­ще про­сто­го».

Крис Таг­гарт из Open Corporates, пор­та­ла, предо­став­ля­ю­ще­го доступ к инфор­ма­ции о мил­ли­о­нах ком­па­ний, при­зна­ет, что делать хоро­шую дата-жур­на­ли­сти­ку труд­но, пото­му что хоро­шая жур­на­ли­сти­ка – это вооб­ще непро­сто: «Необ­хо­ди­мо добыть дан­ные, понять их, разо­брать­ся, где в них спря­та­на исто­рия. Ино­гда все это ведет в нику­да, ино­гда исто­рии про­сто нет. В конеч­ном ито­ге, если бы все сво­ди­лось к нажа­тию пра­виль­ной кноп­ки, это не было бы жур­на­ли­сти­кой. И имен­но поэто­му оно все того сто­ит. В мире, где вся наша жизнь посте­пен­но пре­вра­ща­ет­ся в боль­шой архив дан­ных, такая жур­на­ли­сти­ка ста­но­вит­ся необ­хо­ди­мым усло­ви­ем суще­ство­ва­ния сво­бод­но­го и спра­вед­ли­во­го обще­ства”.

На новый виток эво­лю­ции дата-жур­на­ли­сти­ку, как и мно­гие дру­гие отрас­ли ноосфе­ры, может выве­сти ИИ, пока в фор­ме машин­но­го обу­че­ния. Пер­вые попыт­ки поста­вить ком­пью­тер­ные алго­рит­мы на служ­бу редак­ций уже нача­лись.

Машин­ное обу­че­ние исполь­зо­ва­ла Atlanta Journal-Constitution в рас­сле­до­ва­нии слу­ча­ев сек­су­аль­ных домо­га­тельств со сто­ро­ны вра­чей.

Мето­дом веб-скрей­пин­га газе­та собра­ла око­ло 100 тысяч слу­ча­ев дис­ци­пли­нар­ных дей­ствий в отно­ше­нии мед­ра­бот­ни­ков. Затем с помо­щью ком­пью­тер­но­го алго­рит­ма был про­ана­ли­зи­ро­ван каж­дый кейс.

SRF в Швей­ца­рии с помо­щью алго­рит­мов машин­но­го обу­че­ния попы­та­лась уста­но­вить типич­ные при­зна­ки фей­ко­во­го акка­ун­та в Twitter.

Los Angeles Times исполь­зо­ва­ла ИИ для сво­ей исто­рии «Недо­ста­точ­но осве­щен­ные слу­чаи серьез­ных пре­ступ­ле­ний на про­тя­же­нии 8 лет иска­жа­ют кри­ми­наль­ную ста­ти­сти­ку в Лос-Андже­ле­се».