Армия невидимых работников. Кто тренирует алгоритмы машинного обучения, а иногда даже имитирует их

Искусственный интеллект уже здесь, но капитализм и расизм остались Изображение: Techologies of Care, Elisa Giardina Papa. Скриншот из видео.

«Невидимый бойфренд – парень, который всегда у тебя под рукой и готов выслушать. Построй его прямо сейчас. <…> Цифровая версия настоящего бойфренда без лишнего хлама». Это не шутка из стендапа и не сюжет из «Черного зеркала», а реальный сайт, точнее, – гибкий сервис, который может убедить ваших (англоговорящих) друзей и родственников, что у вас есть парень или девушка. Зачем это нужно? Например, если, они гомофобны и подозревают вас в гомосексуальности. 

Я узнала об Invisible Boyfriend на конференции «Рекурсивный колониализм». Конференция прошла в декабре 2020 года и была посвящена тому, как цифровизация не только упрощает наши жизни, но и воспроизводит логику и механизмы эксплуатации одних стран, наций и социальных групп другими. Художница Элиза Джардина Папа рассказала не только о скрытых проблемах этого сервиса, но и о других формах цифрового эмоционального труда в докладе «Очистка эмоциональных данных» – и я решила законспектировать ее выступление для Теплицы.

Фабрики заботы

«Очистка эмоциональных данных», «Труд сна», «Технологии заботы», – так называются художественные работы в трилогии Элизы Джардины Папы, о которой она говорила на конференции. «Технологии заботы» – особенно емкое и важное выражение. Автоматизация труда – один из ключевых шагов к построению более свободного и справедливого общества. Но какого труда? 

«Рань­ше, ко­гда мы го­во­ри­ли об ав­то­ма­ти­за­ции про­из­вод­ства, мы име­ли в виду ра­бо­ту на фаб­ри­ках, ло­ги­сти­ку, даже ра­бо­ту в офи­се. Но мы упус­ка­ли огром­ное ко­ли­че­ство ре­про­дук­тив­но­го тру­да. <…> За­бо­та о де­тях, за­бо­та о ста­ри­ках, го­тов­ка, убор­ка – весь этот труд от­ча­сти мо­жет быть ав­то­ма­ти­зи­ро­ван, но точ­но не сей­час и не в бли­жай­шем бу­ду­щем», – говорили философы Хелен Хестер и Ник Срничек в недавнем русскоязычном интервью. И добавляли, объясняя, почему именно автоматизация труда заботы сократит или уничтожит рынок крайне незащищенной и несправедливой занятости: «В ин­фра­струк­ту­ры за­бо­ты во­вле­че­ны в ос­нов­ном жен­щи­ны из раз­ви­ва­ю­щих­ся стран. [Именно о]ни смот­рят за детьми, го­то­вят, уби­ра­ют». 

Действительно, освободиться и освободить всех от работы и от необходимости зарабатывать на выживание – большая мечта и цель. Но пока технологии заботы, которые предлагает цифровая индустрия, только на первый взгляд кажутся автоматизированными. На самом деле они создают крайне незащищенные рабочие места.  

Пример цифрового эмоционального труда. «Пожалуйста, оцените, насколько грустным выглядит лицо на картинке». Слово «грустный» переведено также на испанский, арабский и филиппинский. Скриншот из доклада на Recursive Colonialism.

Во-первых, цифровой инструмент, который кажется вам чат-ботом, может оказаться коллективным продуктом, имен и лиц создателей, которого вы не знаете. Таков Invisible Boyfriend – то есть на сайте, конечно, названы его разработчики, но, естественно, не те временные сотрудники, которые действительно переписываются с клиентами. 

Во-вторых, персонализированная, принадлежащая вроде как конкретному человеку страничка может оказаться на самом деле компанией, которая нанимает нескольких авторов постов, а также многих подписчиков, которые имитируют и тем самым создают вовлеченность, спрос. 

Датаклинеры и рекурсия

Какие работы, по наблюдениям Элизы Джардины Папы, составляют сектор незащищенного, отчужденного труда заботы на цифровом рынке?

  • Выполнение студенческих и школьных домашних работ.
  • Исполнение роли фаната-подписчика в социальных сетях.
  • ASMRtist’ы (от ASMR, и artist – художник) – художница еще называет их «производителями фетишей».
  • Дейтинг-коучи, которые дают онлайн-консультации по тому, как действовать на свиданиях или в семейной жизни.

В-третьих, даже настоящие чат-боты и машинные алгоритмы не способны работать без человеческого труда. И речь, опять же, не о программистах, а о так называемых «датаклинерах» (data cleaner – чистильщик данных), то есть людях, которые вручную размечают или создают банки данных для обучения и тестирования алгоритмов.

Какие задачи и за какие деньги выполняют датаклинеры?

  • Вручную выделяют контуры значимых объектов на изображении – Элиза Джардина Папа называет цену в 0,07$ (5 рублей) за одно изображение.
  • Называют объекты на фото – каждое изображение стоит 0,05$ (4 рубля).
  • Оценивают, насколько ярко выражена заданная эмоция на фотографии лица – один набор может стоить 0,5$ (35 рублей).
  • Сами снимают видео с нужными эмоциями и получают, например, 0,35$ (25 рублей) за каждое видео.

Работа непосредственно с эмоциями особенно интересна и проблематична. Необходимость каталогизировать и называть эмоции для искусственного интеллекта возвращает нас к идее «рекурсивного колониализма». 

Про рекурсию вы, возможно, знаете из фразы «чтобы понять рекурсию, сперва нужно понять рекурсию» или из мемов про «экран в экране». Строго говоря, рекурсивный процесс устроен так, что запуск этого процесса запускает внутри аналогичный процесс, а поскольку второй запущенный процесс такой же, он запускает третий – и так далее, если только не задать внешнее условие остановки.

Колониализм тоже воспроизводит сам себя. Чтобы выполнять работу по разметке эмоциональных данных, работники должны следовать универсализированным западным нормам – носителями каких культур ни являлись бы сами. Нормы эти задают западные врачи или, например, спецслужбы. 

Одна из первых исторических систем каталогизации эмоций. Скриншот из доклада на Recursive Colonialism.
Способы машинного описания эмоций сегодня. Скриншот из доклада на Recursive Colonialism.

И да, помните историю о том, что гугл картинки распознавали людей с черным цветом кожи как горилл? Вот это тоже – ад рекурсивного колониализма, и теперь вы, возможно, чуть подробнее представляете, как он устроен.