Канадский стартап научился имитировать речь любого человека

Сперва достоверно имитировать человеческий голос и незаметно изменять уже сказанное научились в Adobe. Осенью прошлого года компания сообщила, что работает над «фотошопом для аудио» и продемонстрировала технологию, которая может максимально правдоподобно генерировать новые слова на основании ранее записанного голоса. Project VoCo дебютировал в рамках конференции Adobe MAX 2016.

Тем не менее, у технологии были существенные издержки. Чтобы изучить характеристики конкретного голоса и научиться его «подделывать», программе требовалось около 20 минут предварительно записанной речи. Новая разработка из Канады способна справиться с задачей гораздо быстрее, но с не менее впечатляющим результатом.

Ноу-хау принадлежит монреальскому стартапу Lyrebird. Для достоверной эмуляции чужой речи и придания ей нужной эмоциональной окраски технология использует искусственный интеллект и нейросети. При этом алгоритму требуется лишь минутная запись имитируемого голоса. Чтобы продемонстрировать возможности системы, разработчики Lyrebird использовали образцы голосов Дональда Трампа, Барака Обамы и Хиллари Клинтон. Сгенерированные роботом голоса как в отдельности, так и в формате беседы, можно послушать ниже.

Разработчики осознают и допускают, что технология может быть использована в преступных целях: например, для подделки доказательств и манипулирования мнением, взлома голосовых замков и даже «угона» чужого голосового ассистента по типу Siri.

В качестве предупредительной меры на сайте опубликован «кодекс этикета», который требует от пользователей не превращать алгоритм в инструмент мошенничества, когда технология станет общедоступной. Сможет ли это заставить преступников отказаться от злых помыслов, можно будет узнать в ближайшем времени, когда выйдет бета-версия исходного кода и набора инструментов Lyrebird для сторонних разработчиков.

27 апреля 2017

Подпишись на наш Twitter

и узнавай о новостях первым!
Написать комментарий
Ваш комментарий