Технологии мгновенного перевода за последние несколько лет сделали большой шаг вперёд, но всё ещё далеки от совершенства. Стартап BabelOn хочет это исправить: его система синтеза речи должна позволить переводить всё, что вы говорите, на множество других языков вашим собственным голосом.
Компания использует своё программное и аппаратное обеспечение в студии в Сан-Франциско для захвата различных атрибутов звучания голоса. Эти атрибуты входят в состав языкового информационного профиля BabelOn (BabelOn Language Information Profile, или BLIP).
Далее, основываясь на полученном профиле, система сможет синтезировать речь на языках, на которых пользователь не говорит. Сейчас разработчики нацелены на английский, французский, испанский, немецкий, португальский, японский, мандаринский китайский языки и хинди.
Технология находится в разработке уже 13 лет. По словам BabelOn, её можно будет использовать в озвучивании фильмов и игр, образовательного контента и виртуальных помощников на телефонах и медицинских устройствах. Более того, система позволит сохранить языки и голоса для потомков и будущего повторного использования.
Впрочем, технология будет готова ещё не скоро. На захват голоса в студии уходит примерно два часа, на генерирование возможностей модуляции и перевода — от недели до нескольких месяцев. Для создания первого прототипа потребуется шесть месяцев. Лишь примерно через три года система сможет переводить в реальном времени.
Для защиты BLIP от кражи и последующего использования со злым умыслом компания собирается использовать «надёжно зашифрованное оффлайн-хранилище». Система будет включать контрольный визуальный сигнал, который указывает на изменения в голосах и языках.