Голосовые технологии: термины, которые нужно знать

По данным экспертов, число голосовых запросов в 2015 году увеличилось в два раза. Изображение: скриншот из ролика на youtube The Wall Street Journal, в котором журналист тестирует голосовой помощник Alexa.
По данным экспертов, число голосовых запросов в 2015 году увеличилось в два раза. Изображение: скриншот из ролика на youtube The Wall Street Journal, в котором журналист тестирует голосовой помощник Alexa.

Как устро­ен про­цесс рас­по­зна­ва­ния и пони­ма­ния речи поль­зо­ва­те­ля? Как рабо­та­ет голо­со­вой поиск? Что пред­став­ля­ют собой интел­лек­ту­аль­ные голо­со­вые помощ­ни­ки? В этой ста­тье мы раз­бе­рем основ­ные поня­тия и тер­ми­ны в обла­сти голо­со­вых тех­но­ло­гий и интер­фей­сов.

Рас­по­зна­ва­ние речи – это про­цесс пре­об­ра­зо­ва­ния рече­во­го сиг­на­ла в циф­ро­вую инфор­ма­цию. Имен­но этот про­цесс поз­во­ля­ет орга­ни­зо­вать рече­вое управ­ле­ние ком­пью­те­ром или про­грам­мой и осу­ще­ствить ввод тек­ста с мик­ро­фо­на. Эта тех­но­ло­гия поз­во­ля­ет созда­вать голо­со­вое команд­ное управ­ле­ние ПК, систе­мы дик­тов­ки тек­ста или сред­ства иден­ти­фи­ка­ции по образ­цу речи.

Пони­ма­ние речи про­цесс, при кото­ром ком­пью­тер или про­грам­ма вос­при­ни­ма­ет смысл ска­зан­но­го. Такая воз­мож­ность ста­ла реаль­ной бла­го­да­ря тех­но­ло­гии искус­ствен­но­го интел­лек­та (ИИ). Бла­го­да­ря ИИ рече­вой интер­фейс может не толь­ко дуб­ли­ро­вать голо­со­вые коман­ды.

Еще по теме: Что такое голо­со­вые тех­но­ло­гии и интер­фей­сы

Голо­со­вой поиск (или голо­со­вая коман­да) функ­ция поис­ка инфор­ма­ции без исполь­зо­ва­ния кла­ви­а­ту­ры. Поль­зо­ва­тель про­из­но­сит фра­зу, а при­ло­же­ние рас­по­зна­ет текст, выпол­ня­ет поиск и предо­став­ля­ет резуль­та­ты на стра­ни­це поис­ко­вой выда­чи. Голо­со­вой поиск, в отли­чие от клас­си­че­ско­го, вза­и­мо­дей­ству­ет с поль­зо­ва­те­лем с помо­щью диа­ло­гов, а не посред­ством клю­че­вых слов и фраз.

Напри­мер, по инфор­ма­ции ана­ли­ти­ка Google Гэри Илш, чис­ло голо­со­вых запро­сов в 2015 году уве­ли­чи­лось в два раза. И такие запро­сы были чаще свя­за­ны с дей­стви­я­ми, чем печат­ные.

Интел­лек­ту­аль­ные голо­со­вые помощ­ни­ки (или голо­со­вые асси­стен­ты)  это веб-сер­ви­сы, кото­рые объ­еди­ня­ют тех­но­ло­гию рас­по­зна­ва­ния речи и тек­ста и поис­ка инфор­ма­ции по клю­че­вым сло­вам. Голо­со­вые помощ­ни­ки уме­ют рас­по­зна­вать речь, опре­де­лять зна­че­ние ска­зан­но­го и син­те­зи­ро­вать голос для отве­та. Основ­ные при­ло­же­ния: Alexa Amazon, Siri Apple, OK GoogleКор­та­на Microsoft, «Али­са» Яндек­са.

Голо­со­вые асси­стен­ты исполь­зу­ют­ся не толь­ко в мобиль­ных при­ло­же­ни­ях и пер­со­наль­ных ком­пью­те­рах, но и в устрой­ствах умно­го дома. Они могут быть внед­ре­ны в холо­диль­ни­ки, быто­вую тех­ни­ку, маши­ны. Или же пред­став­ля­ют собой бес­про­вод­ные дина­ми­ки, снаб­жен­ные голо­со­вым управ­ле­ни­ем.

Пер­во­про­ход­цем в обла­сти голо­со­вых интер­фей­сов высту­па­ет ком­па­ния Amazon. Она выпу­сти­ла голо­со­во­го помощ­ни­ка для дома Amazon Echo. Echo Show  это пер­вич­ное голо­со­вое устрой­ство. На его экране нет при­выч­ных знач­ков при­ло­же­ний. Но когда поль­зо­ва­тель отправ­ля­ет голо­со­вую коман­ду, экран отоб­ра­жа­ет всю свя­зан­ную с ней инфор­ма­цию. Google так­же име­ет ана­лог голо­со­во­го асси­стен­та для дома Google Home.

Еще по теме: Видео­кар­точ­ки Теп­ли­цы: Что может голос

Облач­ные АТС (или облач­ная теле­фо­ния) – про­грамм­ное обес­пе­че­ние, кото­рое заме­ня­ет физи­че­скую офис­ную теле­фон­ную стан­цию. Кли­ент под­клю­ча­ет­ся к услу­ге с помо­щью Интер­не­та. АТС это теле­фон­ная систе­ма ком­па­нии, спо­соб­ная обес­пе­чить под­клю­че­ние внут­рен­них номе­ров к внеш­ним теле­фон­ным лини­ям и мобиль­ным сетям.

Веб-интер­фейс АТС поз­во­ля­ет управ­лять звон­ка­ми, под­клю­чать к систе­ме IP-теле­фо­ны, про­смат­ри­вать ста­ти­сти­ку по звон­кам, запи­сы­вать и сохра­нять раз­го­во­ры. Облач­ную АТС мож­но инте­гри­ро­вать с CRM-систе­мой (систе­мой управ­ле­ния вза­и­мо­от­но­ше­ни­я­ми с кли­ен­та­ми). Бла­го­да­ря такой воз­мож­но­сти при вхо­дя­щем вызо­ве мене­джер уже видит кар­точ­ку кли­ен­та, а зво­нок авто­ма­ти­че­ски попа­да­ет на ответ­ствен­но­го мене­дже­ра.