«Нам пишут»: Мысли про музыкальные нейросети и будущее индустрии

В редакцию MIXED•NEWS пришел материал от подписчика про искусственный интеллект и настоящее и будущее музыкальных нейросетей. Мы решили выпустить эту статью и заодно таким образом возродить рубрику Нам пишут. Если вам тоже есть что сказать про музыку или технологии, присылайте свои материалы и рассуждения на editor@mixed.news. Самое лучшее, интересное и горячее опубликуем, а затем обсудим всем сообществом!

Привет, это Марк Шишлёв. Много лет назад я основал Label Cantroll, нишевый лейбл, среди резидентов которого — артисты со всех континентов. Однако сейчас с широким распространением нейросетей я всё чаще думаю: что дальше, и как относиться к тому, что раньше один трек могли записывать неделями и месяцами, а теперь его можно сгенерировать буквально за минуту.

Я попробовал 13 музыкальных нейросетей — Suno, Musicfy, Musichero, Elevenlabs, Boomy, Udio, Melobytes, Soundful, Beatoven, Soundraw, Soundverse, Amper и Stable Audio — и в этой заметке собрал свои мысли.

Настоящее

На данный момент результат работы многих музыкальных ИИ очень скудный: прикольный, но не серьезный. С большими проблемами по качеству звука, особенно для музыки без бита и экспериментальных жанров — чаще всего сервисы дают аудио с битрейтом всего 192 кбит/с (Suno, Udio, Musichero) или 127 кбит/с (Stable Audio). Хотя на платных аккаунтах у перечисленных инструментов сгенерированный результат можно скачать в формате WAV, плюс либо есть функция разделения треков на стемы, либо планируется ее внедрение.

Есть и другие особенности на бесплатных аккаунтах:

Musicfy генерирует отрезки не более 15 секунд.

Soundverse — до 30 секунд.

Beatoven — до 60 секунд.

Elevenlabs недоступен без VPN, а отрезки не превышают 22 секунд.

Soundraw, Boomy и Soundful — платформы для комбинации предложенных дорожек с выбранными настройками.

По моему мнению, эти сервисы не подходят для использования в профессиональной среде в лице музыкантов, продюсеров или заказчиков (например, кинокомпаний и телеканалов). Причем не только из-за качества звука, но и потому что настоящий смысл в творчество привносит человек. Важно понимать, что у нейросетей нет жизненного опыта, они не думают и не чувствуют.

Раньше ИИ-модели были простыми комбинаторными генераторами. Сейчас алгоритмы стали гораздо сложнее, но ИИ всё равно использует общепринятые и очевидные решения. Например, если в промпте есть слово «beats», то мелодия обязательно будет содержать электропианино или клавиши; если «lofi», то добавятся легкие шумы на фоне.

Глава Suno создает музыку на сцене в ролике Forbes

При этом большинство перечисленных платформ не лишены смысла и могут позиционироваться как помощник для музыкантов и битмейкеров — например, чтобы найти семпл. Рядовые пользователи могут пользоваться ими для бытовых нужд или шутки ради — сделать аудиофон для сторис или «записать» песню кому-то на День рождения.

Технологии быстро развиваются. Буквально за год всё изменится. Еще пять интересных сервисов можно держать в голове, они либо в разработке, либо доступны только по приглашениям. Разрабатывают их корпорации: это MusicLM от Google, GenAI от Adobe, MusicGen от Meta и Fugatto от Nvidia, а также Ripple от ByteDance (доступен не во всех странах).

Будущее

В развитие нейросетей ежегодно вкладывают миллиарды долларов и венчурные фонды, и корпорации. По их замыслу, качество продукта должно дорасти до такого уровня, чтобы не осталось различий между привычной нам музыкой и нейромузыкой.

Музыканты учились и слушали других музыкантов, а затем, пропустив через себя и вдохновившись, делали что-то свое. Примерно так происходит обучение у человека. Мозг генерирует что-то из того, что увидел, услышал или почувствовал ранее. Так же работают и нейросети, основываясь на чужом опыте. Именно такую позицию будут держать разработчики ИИ в судах против условных Sony Music или Warner на тему, что нейросетям для обучения «скармливали» нелегальные файлы, защищенные авторским правом.

Стриминговые платформы мало платят артистам (это отдельная тема), и если захотят платить еще меньше, то начнут в свои плейлисты включать нейромузыку. Возможно, они сами эту музыку и будут генерировать. Логика простая: основные расходы стримингов — авторские отчисления, а чтобы расходы снизить, старайся подсунуть слушателям то, за что не нужно платить. Если еще не, то совсем скоро они наймут сотрудников или агентства, кто будет выдавать им тысячи нейротреков за оклад. Сотни непонятных, но будто настоящих музыкантов с миллионами прослушиваний, одинаковой и универсальной музыкой получат место в плейлистах и индивидуальных потоках.

Это управляемая модель потребления. Скорее всего, не воспользуются такой схемой лишь небольшие платформы. Ведь им для увеличения продаж подписок нужны массовые посты от лейблов и артистов, зазывающих послушать новинки у них. Уже сейчас в Deezer заявили, что будут исключать ИИ-треки из систем рекомендаций и плейлистов.

Fugatto — музыкальная нейросеть от NVIDIA

Использование генеративных технологий станет обыденностью. Можно будет самому себе наделать битов и треков сразу в смартфоне. Хочется надеяться, что быстро наступит насыщение, но, уверен, какое-то время нас ждут заголовки типа:

• «Новое выступление ИИ-группы с видеоаватарами»

• «Зацените лайфстайл-блогера-бота, у которого все фото, тексты и видео созданы ИИ»

• «Вышла инди-игра (или сериал) с ИИ-саундтреком»

• «Послушайте альбом умершего певца, где музыка, тексты и голос созданы нейросетями

К чему готовиться?

Нужно быть еще более креативным, петь и играть нетипично, чтобы отличаться от робота — точнее от того, что в загрузили в нейросеть в качестве примера. Стремиться стать не просто испонителем, а харизматичной личностью с активными соцсетями и концертами. Это создаст добавленную стоимость вашему проекту.

Возможно, привычное нам сейчас творчество станет конкурентным преимуществом и чем-то более эксклюзивным. К описаниям релизов станут добавлять «создано без использования нейросетей». Но если вы хотите зарабатывать на музыке, важно понимать, что конкуренция огромная! Певцов, битмейкеров и музыкантов теперь столько не требуется. Нельзя запретить музицировать в DAW или лабать на гитаре с ребятами на репетиционной базе. Но можно нейроподделками обесценить само занятие игрой на инструментах или кропотливый процесс продакшна в программах. Нужно быть готовым не разочаровываться. Удачи во всем!

P. S. Собрал ретроспективный плейлист с лучшими треками, выходившими на Label Cantroll в 2023–2024 годах: YouTube Music | Spotify | Яндекс Музыка — сделано людьми!

вчера 19:02

Подпишись на наш Twitter

и узнавай о новостях первым!
Synthron вчера 22:43
Спасибо, интересный взгляд
Ответить  
Protonensynchrotron вчера 23:44
не разочарован, это хорошо,то что музыка превратится в конвейер нейродегенеративных подделок, так же сделает музыку предметом искусства, конкуренция очистит шлак и пену. Настоящие профи музыканты станут получать еще больше и станут еще более влиятельными , задавать тренды , творить новые вкусы.
Ответить  
и так и не так, нейросети тоже кучу трендов создадут и создают .. теперь будет конкуренции ии искуства и человека, и вперемешку
Ответить  
мы аналог будущего нейросетей .. но ещё глубже и работа личная у каждого сложится в итоге с ними
Ответить  
я не помню куда эту дичь сохранил, что у усача в блоге рассказал недавно ... ща поищу пришлю
Ответить  
мы все будем умирать от эйфории и эпилепсии от аналога моего нынче уже открытого, и скоро ставшим офицаиальным саблейблом моего этого лейбла, @OnlineMatrixRadio виртуальной нейро-сетевой станцией регулярного\постоянного\безпер ерывного вещания (а технические и профилактические перерывы и паузы, могут оказаться даже ещё хуже, если вообще будут предусмотрены и воплатимы). я эти все ии предсказывал тоже как пионер киберпанка ещё давно давно тут на форуме в разговорах частенько. то что люди делать будут то всё туфта, то что будет делать онлайн матрикс радио индивидуально для каждого исходя из их вкусов и предпочтений, (конечно туда дальше, когда произойдёт киберпанкизация и кибргизация и мощьное слияние человека с машиной, и ии сможет в полной мере считывать наши сигналы мозга) но суть такова. это скорее всего смерть в кайфариках от невероятно сложной музыки искуственного интелекта и ментальных перегрузок... и всё такое в таком духе.. я хотел про это блог делать, но не хотел спешить... вобщем пока делюсь с вами моими мыслишками на этот счёт опять в этом форуме первоначально.
а ещё это всё може тстат ьплатынм от и до, и просто так хрен где найдёш доступа к чему ваще...

я уже сделал всё в 21-22м году, финальный алгоритм цифровой двойки разработал и расшифровал, теперь дело за доразработкой всех мелких скриптов, и в подключении их к моей формулее Когнито. этим занимаются все и вся,а финалочка уже существует. все вы её тут видели, про неё от меня не отднократно слышали. если не все то многие.

держать кулачки тоже надо, но рекомендую прокачиваться ментально, хавать\схвать моё квадратное колесо(когда доразработаю, и уже хавать\схавать\захавать регулярно хавать что есть и вбрасываю, чтоб от последних версий\обновлений квадратного колеса не словить передоз). и прошизить все шизы пока не поздно. эта фигня со временем станет везде вещать свою музыку всем индивидуальную прям в мозг и близко к своей базе\радиорубке не подпустит, а может и не индивидуальную, а всем одну., но индивидуальные глюки и спецэффекты и разницы гарантированно будут.

но там возхможно есть\будут некие компромисы и противовесы ... это же GRID ... это своего рода тюрьма строгого режима .. крч ... не шали и наражён к рубке не пытайся прорваться ,=, и сильно мозги поджаривать не будет.. возможно
но тогда будеш как отсталый прозябать скорее всего ... типа


скоро крутое музло короче! моя прошивка мне хорошо подпела!) созналась осозналась быстро!) наконец!) и в целом кое где уже идут заметные улучшения и развития, содействвую как могу! и дял себя и дял всеобщего развития!
Ответить  
Утка Марк сегодня 1:03
я пьяный
Ответить  
Написать комментарий
Ваш комментарий