Инновационная технология от Microsoft может говорить на иностранном языке, сохраняя ваш голос.
Исследователи Microsoft разработали программное обеспечение, которое воспринимает то, как звучит ваш голос, выучивает его, а потом использует его для того, чтобы синтезировать речь на языке, которого вы не знаете. Эта технология сможет использоваться в говорящих словарях для путешественников или в обучающих программах, что сделает их более персонализированными.
На демонстрационной лекции в Редмонде, США, исследователь Фрэнк Сунг показал, как технология может синтезировать речь на испанском, использую голос своего начальника Рика Рашида, который руководит исследованиями Microsoft. А на второй презентации Сунг подарил возможность Крегу Манди, главе отдела стратегического планирования и исследований Microsoft, говорить по-китайски.
Искусственный голос Манди поприветствовал публику на дне открытых дверей Microsoft Research, сообщив: «С помощью этой системы вы сможете говорить по-китайски». Эта фраза была сказана уже на китайском языке, но абсолютно тем же узнаваемым голосом Манди.
«У этой технологии есть несколько сценариев дальнейшего развития», - сказал Сунг, создавший систему совместно с коллегами из Microsoft Research Asia, второй по размерам исследовательской лаборатории компании, расположенной в Пекине.
«Для путешественников, знающих только один язык, будут созданы устройства, распознающие речь, переводящие на другой язык и озвучивающие перевод, сохраняя голос говорящего», - рассказал Сунг.
Помимо этого, технология может помочь людям, изучающим иностранный язык. Фрази на чужом языке, звучащие узнаваемым голосом, могут вдохновить и будут легче восприниматься. Сунг также продемонстрировал, как новая система сможет улучшить голосовые подсказки навигатора.
Системе нужна как минимум часовая тренировка для создания модели голоса говорящего. Эта модель совмещается с уже существующими моделями голосового вывода текста на иностранном языке. По сути, перевод строится из отдельных звуков говорящего.
Сунг сказал, что этот подход работает с любыми языками, включая китайский, испанский и итальянский.
Сохранение голоса пользователя при переводе текста на другой язык поможет сделать перевод более убедительным и сделают работу приложений-переводчиков более естественной, - сказал Шрикант Нарайанан, профессор Южно-Калифорнийского Университета в Лос-Анджелесе, работающий над подобными системами перевода речи в таких ситуациях, как общение доктора с пациентом.
«Слова – всего лишь часть того, что говорит человек, и для того, чтобы полностью передать информацию, содержащуюся в речи, система перевода должна уметь сохранять голос говорящего и много другое. Сохранение голоса, интонации – все это очень важно. Подобным системам нужно уметь улавливать выражение говорящего, знать, что это за человек и как он произносит различные выражения», - рассказал Нарайанан.
Его исследовательская группа занимается тем, что изучает, как такие параметры голоса, как ударение, интонация и то, как человек расставляет паузы, влияют на воспринятие искусственной речи. «Мы задались вопросом, возможно ли создать систему, которая будет не просто заменять слова», - сказал он. «Я думаю, что исследования Microsoft сделают это возможным».