MIXED•NEWS

ИИ от Google научили генерировать саундтреки и озвучку к любым видео

Лаборатория Google DeepMind представила новый ИИ-инструмент V2A для озвучки любых видео. Технология может генерировать музыку, соответствующую ролику, добавлять звуковые эффекты и озвучивать персонажей — всё это по текстовым промтам или даже без них. Нейросеть обучалась на библиотеках звуков, расшифровок диалогов и видео.

Пример со звуковыми эффектами и музыкой

Любопытно, что в качестве источника видео может быть и немой фильм, и архивные съемки, анимация и так далее. Как заявляют авторы, отличие в том, что их ИИ понимает видеоряд и синхронизирует саундтрек именно под него с учетом запросов пользователей. Иными словами, нейросеть научилась ассоциировать определенные звуки с визуальными образами. При этом разработчики признают, что пока технология неидеальна. К примеру, журналисты издания TechCrunch описали результат как «сборную солянку из стереотипных звуков». Со временем ситуация должна улучшиться.

«Генерация видео совершенствуется семимильными шагами, правда многие модели создают видео абсолютно без звука. Первые результаты показывают, что у нас появилась многообещающая технология для претворения в жизнь генеративных роликов», — говорится в пресс-релизе компании

Промт для аудио: кинематографичный, триллер, хоррор, музыка, напряжение, шаги

19 июня 2024

Подпишись на наш Telegram

и узнавай о новостях первым!

Makarov 19 июня 2024 17:24

Где ты, Джон Коннор? Будущее так близко...

Ответить

Написать комментарий

Исследование: музыка и видеоклипы — главный триггер ностальгии для всех поколений

Цены билетов на музыкальные фестивали в России снова выросли

Подпишись на наш Telegram

и узнавай о новостях первым!

В Logic Pro появился ИИ-аккомпанемент

YouTube представил несколько нейросетей для генерации музыки

Коротко о новых ИИ-инструментах для создания музыки: Dream Track и Music AI Tools

В Spotify тестируют ИИ-функцию генерации плейлистов по текстовому запросу

AI Playlist по текстовому промпту свободного содержания составляет подборки благодаря технологии LLM (большой языковой модели)

Больше 200 известных музыкантов призвали остановить разработку ИИ

Под открытым письмом подписались Джон Бон Джови, Билли Айлиш, Стиви Уандер, Imagine Dragons, Ники Минаж, Кэти Перри и другие представители индустрии

Цены билетов на музыкальные фестивали в России снова выросли

Deezer: ИИ-музыка впервые обогнала человеческую по загрузкам

Не винилом единым: CD-формат в 2026-м растет даже быстрее

Последнее лет 15 лицом возрождения физносителей считался винил, но, судя по отчету Luminate за 2026 год, даже более заметный подъем переживает CD-формат

Хакеры выяснили, откуда Suno брала музыку для обучения моделей

Журналистам передали фрагменты исходного кода 2023–2024 годов и внутреннюю документацию, которые раскрывают, откуда именно Suno собирала датасеты для обучения моделей