Технология Content Clarifier от IBM сделает Интернет доступнее для людей с аутизмом

Для создания технологии IBM использует возможности машинного обучения. Фото: скриншот промо-видео на YouTube
Для создания технологии IBM использует возможности машинного обучения. Фото: скриншот промо-видео на YouTube.

Компания IBM работает над усовершенствованием технологии Content Clarifier. Это приложение способно адаптировать текстовый веб-контент таким образом, чтобы он был более понятен людям с расстройствами аутического спектра и другими видами когнитивных расстройств.

Над технологией работают специалисты подразделения IBM Accessibility Research, используя для адаптации контента машинное обучение и технологии распознавания языка.

Еще по теме: DistingTec – российский проект по трудоустройству людей с аутизмом в IT-сфере

Content Clarifier может упрощать предложения, сохраняя смысл. Для этого система анализирует источник информации, определяет важные данные и отсеивает все необязательное. Технология позволяет сделать текст богаче – в процессе обработки не только убираются эвфемизмы, но и добавляется релевантный контент, к примеру, ссылки на статьи в Википедии.

У веб-приложения сейчас есть 3 режима работы с текстом, каждый из которых позволяет сделать его еще более доступным. Фото: скриншот видео YouTube
У веб-приложения сейчас есть три режима работы с текстом, каждый из которых позволяет сделать его еще более доступным. Фото: скриншот видео YouTube.

Источником для преобразования может быть как pdf или word-файл или html-страница с текстом, так и аудиофайл с записью речи. Сейчас для демонстрации возможностей технологии Content Clarifier работает как веб-приложение, однако IBM предлагает разработчикам использовать API для создания своих приложений.

Веб-приложение дает возможность протестировать технологию в трех форматах:

  1. упрощенный текст, когда сложные понятия заменяются на более простые, дополнительный контент в виде гиперссылок и изображений помогает лучше разобраться с явлением;
  2. выжимка из текста, когда убирается большое количество дополнительной и вводной информации и остается только главный тезис;
  3. режим «ультра», упрощение выжимки.