Как в Google изобретают звуки, которые раньше никто не слышал

Мутирующий саунд и новые горизонты

Джесси Энджел играет на необычном гибридном инструменте, в котором переплелись клавикорд и электроорган Hammond, а саунд классической музыки 18 века — с ритм-н-блюзом двадцатого. Одно лёгкое перемещение маркера на экране ноутбука, и инструментальные пропорции в очередной раз меняются, а вместе с ними и звуковой окрас.

«В этом нет ничего общего с игрой на двух инструментах одновременно», — бросает ремарку один из коллег Энджела, Синьон Резник, сидящий в другом конце комнаты. Фраза предельно чётко описывает концепцию происходящего. Cпециальная программа не просто накладывают клавикорд поверх Хаммонда — вместо этого компьютер генерирует абсолютно новые звуки на основании математических характеристик нот обоих инструментов. Разработчики могут провернуть этот трюк с тысячей разных музыкальных инструментов — от скрипки до вибрафона — создавая океан уникальных, никогда не существовавших ранее звуков, отталкиваясь от уже хорошо знакомых. И всё это благодаря искусственному интеллекту (ИИ) и нейросетям.

Энджел и Резник работают в Google Magenta, небольшой группе ИИ-исследователей в составе гигантской интернет-корпорации. Их миссия — компьютерные системы, способные самостоятельно создавать произведения искусства. Гибридный музыкальный генератор NSynth — финальный проект команды. Дебютная демонстрация его возможностей состоится в рамках Moogfest 2017.

По задумке Google, NSynth откроет перед музыкантами новый портал возможностей и набор инструментов для создания музыки в цифровую эпоху. С другой стороны, оказывается, концепция далеко не нова: например, критик Марк Вейденбаум сравнивает синтезаторную работу ИИ с многовековой практикой дирижирования оркестром и совмещения инструментов в разных пропорциях. Главная ценность ноу-хау в данном случае — артистическая: неожиданные, оригинальные результаты звуковых экспериментов, а также признание бренда Google, по его мнению, делают NSynth очень перспективной наработкой.

За границы звука и возможностей

В основе NSynth лежит массивная база данных со звуками. Исследователи накопили широкий диапазон нот, сыгранных на тысяче разных инструментов, а затем «скормили» их нейросети. Анализируя ноты, нейросети Google Brain и Deepmind выучили звуковые характеристики каждого инструмента в отдельности, и присвоили им математические «векторы». Используя эти векторы, машина может не просто сымитировать игру условного клавикорда или саксофона, но и создать уникальный саунд, сочетающий черты звука обоих инструментов.

Примеры работы нейросети WaveNet в составе генератора NSynth: в верхнем ряду расположены оригиналы звуковых отпечатков, в нижнем — результат обработки искусственным интеллектом (новый производный звук)

Но продемонстрированный Энджелом в лаборатории Google процессор физико-акустического моделирования — лишь верхушка айсберга. В дополнение к NSynth команда Magenta придумала двухмерный интерфейс, позволяющий исследовать и мутировать «звуковое пространство» меду четырьмя инструментами сразу, но и это не предел. Разработчики хотят развить идею ещё дальше, чтобы создать по-настоящему новые и экспериментальные формы музыкального самовыражения и продакшна. Например, параллельно с созданием звуков в «инкубаторе», другая нейронная сеть сможет мгновенно обучаться саунд-дизайну и самостоятельно производить похожие пресеты или предлагать варианты гибридных инструментов.

Если у Google всё получится, то уже в скором времени один бот-продюсер сможет работать в студийном тандеме с другим. И тогда музыкантам придётся считаться с искусственным интеллектом всерьёз

Тем временем человечество пытается решить вопросы более злободневного характера: например, приручить зверя по имени стриминг так, чтобы это было выгодным для всех сторон — слушателей, потоковых сервисов, лейблов и музыкантов. Самый последний тренд в этом направлении — блокчейн, как ни странно. О феномене музыки и децентрализованных технологий мы вам расскажем уже в скором времени.

15 мая 2017

Подпишись на наш Facebook

и узнавай о новостях первым!
FFT морфинг, что-то вроде этого www.native-instruments.com/en/ …
Ответить  
Написать комментарий
Ваш комментарий