Популярные решения и разработки в области голосовых технологий

Компания Soul Machines учит машины распознавать и проявлять эмоции. Она создает виртуальных ассистентов, которые умеют не только общаться голосом, но и выражать эмоции на основе «цифровой нервной системы». Изображение: скриншот из ролика на официальном канале компании Soul Machines на Youtube
Компания Soul Machines учит машины распознавать и проявлять эмоции. Она создает виртуальных ассистентов, которые умеют не только общаться голосом, но и выражать эмоции на основе «цифровой нервной системы». Изображение: скриншот из ролика на официальном канале компании Soul Machines на Youtube

Циф­ро­вые тех­но­ло­гии все боль­ше ста­ра­ют­ся вза­и­мо­дей­ство­вать с поль­зо­ва­те­лем есте­ствен­ным обра­зом: с помо­щью опре­де­ле­ния эмо­ций, рас­по­зна­ва­ния команд, кото­рые чело­век гово­рит, а не вво­дит с помо­щью кла­ви­а­ту­ры. Рынок интел­лек­ту­аль­ных асси­стен­тов уве­ли­чи­ва­ет­ся: у каж­дой круп­ной меж­ду­на­род­ной ком­па­нии есть своя раз­ра­бот­ка. Теп­ли­ца сде­ла­ла обзор попу­ляр­ных голо­со­вых помощ­ни­ков.

По про­гно­зам иссле­до­ва­тель­ской ком­па­нии Gartner, к 2018 году в 30% слу­ча­ев люди будут отда­вать домаш­ним гад­же­там имен­но голо­со­вые коман­ды.

Alexa

Приложения Alexa. Изображение: скриншот с сайта www.amazon.com
При­ло­же­ния Alexa. Изоб­ра­же­ние: скрин­шот с сай­та www.amazon.com

Alexa голо­со­вой помощ­ник ком­па­нии Amazon, кото­рый стре­ми­тель­но набрал попу­ляр­ность. Плюс Alexa в том, что он открыт для сто­рон­них раз­ра­бот­чи­ков. Это зна­чит, что раз­ра­бот­чи­ки могут «научить» его новым навы­кам. На дан­ный момент у при­ло­же­ния 15 тысяч навы­ков.

Alexa уме­ет добав­лять това­ры в «кор­зи­ну», про­иг­ры­вать музы­ку через сер­вис Amazon Prime Music, отве­чать на раз­лич­ные вопро­сы и совер­шать про­стые вычис­ле­ния.

У ком­па­нии Amazon есть целая эко­си­сте­ма голо­со­во­го домаш­не­го управ­ле­ния, а голо­со­вой помощ­ник внед­ря­ет­ся во мно­гие устрой­ства. Напри­мер, он инте­гри­ро­ван в умные колон­ки Echo, Echo Dot, Tap, при­став­ки Fire TV.

На еже­год­ной меж­ду­на­род­ной выстав­ке потре­би­тель­ской элек­тро­ни­ки в 2017 году было объ­яв­ле­но, что Alexa ста­нут исполь­зо­вать в новых холо­диль­ни­ках мар­ки LG и смарт­фо­нах Huawei’s Mate 9. Кро­ме того, ком­па­ния Nissan доба­ви­ла частич­ную под­держ­ку Alexa в свои новые авто­мо­би­ли.

Сайт Alexa.

Google Assistant

Умный пер­со­наль­ный асси­стент, кото­рый раз­ра­бо­та­ла ком­па­ния Google в 2016 году. Про­дукт счи­та­ет­ся про­дол­же­ни­ем пер­со­на­ли­зи­ро­ван­но­го сер­ви­са поис­ка Google Now, но, в отли­чие от него, уме­ет участ­во­вать в двух­сто­рон­них пере­го­во­рах.

Помощ­ник вклю­чен в при­ло­же­ние для мгно­вен­но­го обме­на сооб­ще­ни­я­ми Google Allo, в умный голо­со­вой Wi-Fi дина­мик для управ­ле­ния вашим домом Google Home, умные часы от Google Android Wear и в теле­фо­ны от Google Google Pixel.

Сайт Google Assistant.

Siri

Голо­со­вой асси­стент ком­па­нии Apple, кото­рый уме­ет раз­го­ва­ри­вать с поль­зо­ва­те­лем и давать реко­мен­да­ции. Акти­ви­ру­ет­ся дол­гим нажа­ти­ем на кноп­ку «домой» на iPhone и iPad, есть под­держ­ка асси­стен­та на Apple TV и Apple Watch, в умной колон­ке Apple HomePod. Может рас­ска­зать послед­ние ново­сти, про­гноз пого­ды, под­ска­зать марш­рут, что посмот­реть в кино и по теле­ви­зо­ру.

Еще по теме: Голо­со­вые тех­но­ло­гии: тер­ми­ны, кото­рые нуж­но знать

Подроб­нее на сай­те Apple.

Алиса

Голо­со­вой помощ­ник ком­па­нии Яндекс, запу­щен­ный в октяб­ре 2017 года. При­ло­же­ние доступ­но для Android и iPhone, одна­ко пока его нель­зя рас­смат­ри­вать как пол­но­цен­но­го вир­ту­аль­но­го помощ­ни­ка. Боль­шин­ство отве­тов Али­сы пред­став­ле­но в фор­ме выда­чи поис­ко­во­го запро­са. При­ло­же­ние уме­ет рас­по­зна­вать голос, про­кла­ды­вать марш­рут, дает сове­ты и реко­мен­да­ции, отве­ча­ет на вопро­сы и реша­ет зада­чи.

Сайт «Али­са»

Кортана

Кор­та­на вир­ту­аль­ный асси­стент с тек­сто­вым и голо­со­вым вво­дом ком­па­нии Microsoft. Он досту­пен на Windows, iOS и Android. Спо­со­бен преду­га­ды­вать и отве­чать на вопро­сы поль­зо­ва­те­лей, управ­лять напо­ми­на­ни­я­ми и кален­да­рем, уста­нав­ли­вать будиль­ни­ки, соби­рать нуж­ную инфор­ма­цию из сети.

В октяб­ре 2017 года голо­со­вой помощ­ник был инте­гри­ро­ван в Skype, пока функ­ция доступ­на для жите­лей США. Кор­та­на рабо­та­ет не во всех стра­нах и реги­о­нах. Для поль­зо­ва­те­лей Windows при­ло­же­ние бес­плат­ное.

О Кор­тане на сай­те Microsoft.

Проект BabyX

Отдель­но сто­ит рас­ска­зать про раз­ра­бот­ки ново­зе­ланд­ско­го про­грам­ми­ста, про­фес­со­ра Окленд­ско­го уни­вер­си­те­та и гене­раль­но­го дирек­то­ра ком­па­нии Soul Machines Мар­ка Сага­ра. Ком­па­ния учит маши­ны рас­по­зна­вать и про­яв­лять эмо­ции. Она созда­ет вир­ту­аль­ных асси­стен­тов, кото­рые уме­ют не толь­ко общать­ся голо­сом, но и выра­жать эмо­ции на осно­ве «циф­ро­вой нерв­ной систе­мы».

При­ме­ча­тель­ны два про­ек­та ком­па­нии: BabyX и робот-асси­стент по име­ни Надя. Про­ект BabyX пред­став­ля­ет собой 3D-модель ребен­ка, кото­рая может реа­ги­ро­вать на запро­сы людей. Такая ани­ма­ция с есте­ствен­ной мими­кой созда­на на осно­ве подроб­ной кар­ты чело­ве­че­ско­го моз­га. Автор про­ек­та Марк Сагал может, убрав лицо ребен­ка, пока­зать, как на запро­сы реа­ги­ру­ют ее «ней­ро­ны».

Еще по теме: Рече­вые тех­но­ло­гии: голос из пре­крас­но­го дале­ка

Вир­ту­аль­ный асси­стент Надя уме­ет рас­по­зна­вать эмо­ции чело­ве­ка-собе­сед­ни­ка по выра­же­нию лица. Голос для нее в тече­ние 15 часов запи­сы­ва­ла актри­са Кейт Блан­шетт.

Этот про­ект ком­па­ния раз­ра­бо­та­ла по зака­зу Наци­о­наль­но­го агент­ства стра­хо­ва­ния по инва­лид­но­сти. Робот пла­ни­ру­ет­ся исполь­зо­вать для онлайн-помо­щи более 500 тыся­чам людей с огра­ни­чен­ны­ми воз­мож­но­стя­ми.

Ком­па­ния утвер­жда­ет, что у чат-бота «эмо­ци­о­наль­ный интел­лект», кото­рый поз­во­ля­ет робо­там быть бли­же к людям на эмо­ци­о­наль­ном уровне.

«Види­мо, до все боль­ше­го чис­ла людей, зани­ма­ю­щих­ся голо­со­вы­ми асси­стен­та­ми, дохо­дит: про­сто текст, без сопро­вож­да­ю­щих невер­баль­ных сооб­ще­ний, не может заме­нить чело­ве­че­ское обще­ние, поэто­му убе­ди­тель­ны­ми мими­че­ски­ми моде­ля­ми зани­мать­ся надо сроч­но. И даже ста­но­вит­ся инте­рес­но, дол­го ли будут Сири, Алек­са и Али­са оста­вать­ся бес­те­лес­ны­ми голо­са­ми», – сде­лал вывод дирек­тор по мар­ке­тин­гу сер­ви­сов ком­па­нии «Яндекс» Андрей Себрант в сво­ем теле­грам-кана­ле.

«Собеседник HD»

Голо­со­вой помощ­ник, создан­ный ком­па­ни­ей-раз­ра­бот­чи­ком iOS-при­ло­же­ний iDeveloper мож­но назвать ана­ло­гом Siri. Инте­рес­но, что сло­вар­ный запас собе­сед­ни­ка попол­ня­ет­ся поль­зо­ва­тель­ски­ми вопро­са­ми.

Доступ­ны функ­ции асси­стен­та, голо­со­во­го поис­ка: мож­но уста­но­вить будиль­ник и напо­ми­на­ние, най­ти инфор­ма­цию в Интер­не­те, набрать сооб­ще­ние, сде­лать вызов и даже поиг­рать в горо­да.

Сайт «Собе­сед­ник HD».