Существующие системы компьютерного синтеза речи основаны на технологиях прошедшего века — утверждают авторы системы WaveNet.
Профессионалы компании задались целью в дальнейшем предоставить возможность людям общаться с машинами, передает odintsovo.ru.
По мнению разработчиков проекта, WaveNet приблизит население Земли к тому моменту, когда будет возможность общаться с компьютерами свободно. При помощи данной новинки система может воссоздавать человеческую речь либо имитировать любой определенный голос. Наряду с этим профессионалы DeepMind протестировали систему, которая дает возможность на основе анализа традиционной музыки генерировать короткие композиции на фортепиано.
В отличие от обычных алгоритмов синтеза речи, которые построены на комбинировании заблаговременно записанных фонетических последовательностей, WaveNet синтезирует речь, анализируя звуковые волны и производя комплексные вычисления. Она достигается благодаря применению нейронных сетей. Эта система в корне отличается от действующих синтезаторов голоса, которые используют аудиозаписи, выделяя звуки и компонуя их на основе введенных текстовых данных. В технологии WaveNet речь идет о том, чтобы синтезировать речь, идентичную человеческой.
Пока технология момент не применяется ни в одном из продуктов Google, тем как минимум, она может быть применена в будущем. Базирующаяся в столице Англии компания DeepMind специализируется на разработках в сфере искусственного интеллекта. Google приобрел ее в минувшем году. Об этом стало известно из пресс-релиза американской компании.
— Обзор прессы по области (отраслевые и деловые, закрытые и открытые, федеральные и областные источники).

Комментировать