Голосовые технологии: термины, которые нужно знать

По данным экспертов, число голосовых запросов в 2015 году увеличилось в два раза. Изображение: скриншот из ролика на youtube The Wall Street Journal, в котором журналист тестирует голосовой помощник Alexa.
По данным экспертов, число голосовых запросов в 2015 году увеличилось в два раза. Изображение: скриншот из ролика на youtube The Wall Street Journal, в котором журналист тестирует голосовой помощник Alexa.

Как устроен процесс распознавания и понимания речи пользователя? Как работает голосовой поиск? Что представляют собой интеллектуальные голосовые помощники? В этой статье мы разберем основные понятия и термины в области голосовых технологий и интерфейсов.

Распознавание речи – это процесс преобразования речевого сигнала в цифровую информацию. Именно этот процесс позволяет организовать речевое управление компьютером или программой и осуществить ввод текста с микрофона. Эта технология позволяет создавать голосовое командное управление ПК, системы диктовки текста или средства идентификации по образцу речи.

Понимание речи процесс, при котором компьютер или программа воспринимает смысл сказанного. Такая возможность стала реальной благодаря технологии искусственного интеллекта (ИИ). Благодаря ИИ речевой интерфейс может не только дублировать голосовые команды.

Еще по теме: Что такое голосовые технологии и интерфейсы

Голосовой поиск (или голосовая команда) функция поиска информации без использования клавиатуры. Пользователь произносит фразу, а приложение распознает текст, выполняет поиск и предоставляет результаты на странице поисковой выдачи. Голосовой поиск, в отличие от классического, взаимодействует с пользователем с помощью диалогов, а не посредством ключевых слов и фраз.

Например, по информации аналитика Google Гэри Илш, число голосовых запросов в 2015 году увеличилось в два раза. И такие запросы были чаще связаны с действиями, чем печатные.

Интеллектуальные голосовые помощники (или голосовые ассистенты)  это веб-сервисы, которые объединяют технологию распознавания речи и текста и поиска информации по ключевым словам. Голосовые помощники умеют распознавать речь, определять значение сказанного и синтезировать голос для ответа. Основные приложения: Alexa Amazon, Siri Apple, OK GoogleКортана Microsoft, «Алиса» Яндекса.

Голосовые ассистенты используются не только в мобильных приложениях и персональных компьютерах, но и в устройствах умного дома. Они могут быть внедрены в холодильники, бытовую технику, машины. Или же представляют собой беспроводные динамики, снабженные голосовым управлением.

Первопроходцем в области голосовых интерфейсов выступает компания Amazon. Она выпустила голосового помощника для дома Amazon Echo. Echo Show  это первичное голосовое устройство. На его экране нет привычных значков приложений. Но когда пользователь отправляет голосовую команду, экран отображает всю связанную с ней информацию. Google также имеет аналог голосового ассистента для дома Google Home.

Еще по теме: Видеокарточки Теплицы: Что может голос.

Облачные АТС (или облачная телефония) – программное обеспечение, которое заменяет физическую офисную телефонную станцию. Клиент подключается к услуге с помощью Интернета. АТС это телефонная система компании, способная обеспечить подключение внутренних номеров к внешним телефонным линиям и мобильным сетям.

Веб-интерфейс АТС позволяет управлять звонками, подключать к системе IP-телефоны, просматривать статистику по звонкам, записывать и сохранять разговоры. Облачную АТС можно интегрировать с CRM-системой (системой управления взаимоотношениями с клиентами). Благодаря такой возможности при входящем вызове менеджер уже видит карточку клиента, а звонок автоматически попадает на ответственного менеджера.