Компания Бекмамбетова и разработчик рекрутера «Робот Вера» создали технологию синтеза голоса знаменитостей

вторник, 29 октября 2019 г.

Её планируют использовать для озвучки фильмов, сериалов и рекламы.

В закладки

Screenlife Technologies Тимура Бекмамбетова и «Стафори», разработчик HR-сервиса «Робот Вера», запустили Vera Voice — проект по синтезу голоса знаменитостей. Для его развития они создадут совместное предприятие, сообщает РБК.

Проект работает на основе нейросети, которая анализирует голос человека, воспроизводит его цифровую копию и самостоятельно обучается. В разговоре с vc.ru сооснователь «Стафори» Владимир Свешников рассказал, что копия голоса синтезируется с учётом специфического произношения слов, скорости речи, интонаций и тембра.

С обладателями голоса планируют заключать договор. Среди областей применения проекта назвали голосовые поздравления, розыгрыши и «умные» устройства. Vera Voice также планируют использовать для озвучки рекламы, фильмов, аудиокниг, литературных произведений и приложений на основе фильмов.

Для синтеза голоса достаточно нескольких часов аудиоданных, озвученных обладателем голоса и оцифрованный текст, который он зачитывает. Аудиопоток и текст «выгружаются» в несколько нейронных сетей одновременно, одна — генерирует спектрограмму звука (его визуальное изображение), а вторая — непосредственно звук.

Владимир Свешников

сооснователь Stafory

Первые проекты планируют запустить в течение месяца, договор на легальное использование голоса уже подписали с сооснователем студии «Кубик в кубе» Русланом Габидуллиным.

Компания пообещала следить за авторскими правами и появлением голосовых клонов. «Отлавливать подделки и защищать известных людей от несанкционированного копирования их образов — одна из главных задач нашего проекта», — заявил Бекмамбетов.

Vera Voice — не первый продукт в этой области, но разработчики назвал его первым, способным синтезировать голоса знаменитостей на русском языке. В июле Facebook представили синтезатор, который сгенерировал голос Стивена Хокинга и Билла Гейтса. За пару месяцев до этого стартап AI Dessa показал аудиоклип с голосом радиоведущего Джо Рогана.

«Робот Вера» — сервис для подбора сотрудников на базе искусственного интеллекта с технологией распознавания речи. Screenlife Technologies разрабатывает формат съёмки, где действия происходят на экранах компьютеров и других девайсов. Этот формат использовали при работе над фильмами «Поиск», «Убрать из друзей» и многосерийном проекте для мобильных телефонов 1968. Digital.

Let's block ads! (Why?)