Компания Mozilla запустила систему распознавания речи с открытым кодом

Опубликован первый выпуск модели для системы машинного обучения, которая ориентирована на распознавание речи. Изображение с сайта: blog.mozilla.org
Опубликован первый выпуск модели для системы машинного обучения, которая ориентирована на распознавание речи. Изображение с сайта: blog.mozilla.org

Ком­па­ния Mozilla опуб­ли­ко­ва­ла пер­вый выпуск моде­ли рас­по­зна­ва­ния речи с откры­тым исход­ным кодом и набор голо­со­вых дан­ных, в кото­рый вошли при­ме­ры про­из­но­ше­ния почти 20 тысяч чело­век по все­му миру. Об этом пред­ста­ви­те­ли ком­па­нии напи­са­ли в бло­ге про­ек­та 29 нояб­ря 2017 года.

Базу голо­со­вых шаб­ло­нов уда­лось собрать бла­го­да­ря доб­ро­воль­цам: они надик­то­ва­ли почти 400 тысяч запи­сей общей про­дол­жи­тель­но­стью 500 часов. Все эти запи­си мож­но ска­чать в сво­бод­ном досту­пе. Такой доступ­ный набор поз­во­лит натре­ни­ро­вать модель для систе­мы машин­но­го обу­че­ния до уров­ня рас­по­зна­ва­ния речи. При этом чис­ло оши­бок будет соот­вет­ство­вать рас­по­зна­ва­нию чело­ве­ком.

«Мы пола­га­ем, что эта тех­но­ло­гия под­толк­нет к волне инно­ва­ци­он­ных про­дук­тов и услуг. Она долж­на быть доступ­на всем», – напи­са­но в бло­ге ком­па­нии.

Сей­час исполь­зу­ет­ся тек­сто­вый набор дан­ных LibriSpeech, в кото­ром чис­ло оши­бок рас­по­зна­ва­ния состав­ля­ет все­го 6,5%. За осно­ву систе­мы рас­по­зна­ва­ния речи Mozilla исполь­зу­ет дви­жок с откры­тым кодом DeepSpeech.

Еще по теме: Попу­ляр­ные реше­ния и раз­ра­бот­ки в обла­сти голо­со­вых тех­но­ло­гий

Имея модель рас­по­зна­ва­ния речи и при­ме­ры про­из­но­ше­ния, раз­ра­бот­чи­ки смо­гут экс­пе­ри­мен­ти­ро­вать. Более того, Mozillа пред­ло­жи­ла гото­вые моду­ли для Python и NodeJS. С их помо­щью мож­но встро­ить в свои про­грам­мы функ­ции рас­по­зна­ва­ния речи. Еще есть инстру­мен­та­рий для рас­по­зна­ва­ния из команд­ной стро­ки.

Пока под­дер­жи­ва­ет­ся толь­ко англий­ский язык, но в пла­нах созда­те­лей в 2018 году при­сту­пить к сбо­ру при­ме­ров и на дру­гих язы­ках.