пн-пт: 9:00 - 18:00
8 (812) 386-99-80
Санкт-Петербург
8 (495) 988-99-80
Москва
обратный звонок

14 марта 2012  Новая технология переведет вашу речь на другой язык, сохранив голос

Инновационная технология от Microsoft может говорить на иностранном языке, сохраняя ваш голос.

Исследователи Microsoft разработали программное обеспечение, которое воспринимает то, как звучит ваш голос, выучивает его, а потом использует его для того, чтобы синтезировать речь на языке, которого вы не знаете. Эта технология сможет использоваться в говорящих словарях для путешественников или в обучающих программах, что сделает их более персонализированными.

На демонстрационной лекции в Редмонде, США, исследователь  Фрэнк Сунг показал, как технология может синтезировать речь на испанском, использую голос своего начальника Рика Рашида, который руководит исследованиями Microsoft. А на второй презентации Сунг подарил возможность Крегу Манди, главе отдела стратегического планирования и исследований Microsoft, говорить по-китайски.

Искусственный голос Манди поприветствовал публику на дне открытых дверей Microsoft Research, сообщив: «С помощью этой системы вы сможете говорить по-китайски». Эта фраза была сказана уже на китайском языке, но абсолютно тем же узнаваемым голосом Манди.

«У этой технологии есть несколько сценариев дальнейшего развития», - сказал Сунг, создавший систему совместно с коллегами из Microsoft Research Asia, второй по размерам исследовательской лаборатории компании, расположенной в Пекине.

«Для путешественников, знающих только один язык, будут созданы устройства, распознающие речь, переводящие на другой язык и озвучивающие перевод, сохраняя голос говорящего», - рассказал Сунг.

Помимо этого, технология может помочь людям, изучающим иностранный язык. Фрази на чужом языке, звучащие узнаваемым голосом, могут вдохновить и будут легче восприниматься. Сунг также продемонстрировал, как новая  система сможет улучшить голосовые подсказки навигатора.

Системе нужна как минимум часовая тренировка для создания модели голоса говорящего.  Эта модель совмещается с уже существующими моделями голосового вывода текста на иностранном языке. По сути, перевод строится из отдельных звуков говорящего.

Сунг сказал, что этот подход работает с любыми языками, включая китайский, испанский и итальянский.

Сохранение голоса пользователя при переводе текста на другой язык поможет сделать перевод более убедительным и сделают работу приложений-переводчиков более естественной, - сказал Шрикант Нарайанан, профессор Южно-Калифорнийского Университета в Лос-Анджелесе, работающий над подобными системами перевода речи в таких ситуациях, как общение доктора с пациентом.

«Слова – всего лишь часть того, что говорит человек, и для того, чтобы полностью передать информацию,  содержащуюся в речи, система перевода должна уметь сохранять голос говорящего и много другое. Сохранение голоса, интонации – все это очень важно. Подобным системам нужно уметь улавливать выражение говорящего, знать, что это за человек и как он произносит различные выражения», - рассказал Нарайанан.

Его исследовательская группа занимается тем, что изучает, как такие параметры голоса, как ударение, интонация и то, как человек расставляет паузы, влияют на воспринятие искусственной речи. «Мы задались вопросом, возможно ли создать систему, которая будет не просто заменять слова», - сказал он. «Я думаю, что исследования Microsoft сделают это возможным».

По материалам
Tom Simonite
9 March 2012
http://www.technologyreview.com/computing/39885/page1/

Перевод: Нурсеитов Евгений