Stability AI выпустила бесплатную модель для генерации звуков и семплов на смартфонах

Компания Stability AI представила новую модель генерации аудио Stable Audio Open Small, способную работать на смартфонах и оптимизированную для Arm-процессоров, которые используются в большинстве мобильных устройств. Модель с открытым кодом содержит 341 млн параметров и предназначена для быстрой генерации мелодий, семплов и звуковых эффектов. По заверениям компании, генерация до 11 секунд аудио занимает меньше 8 секунд.

Stable Audio Open Small доступна бесплатно на Github для коммерческого и некоммерческого использования по лицензии Stability AI Community License. Особенностью модели является использование исключительно легальных и свободных аудиозаписей из репозиториев Free Music Archive и Freesound для обучения, что отличает ее, например, от Suno и Udio, использующих защищенные авторским правом материалы.

Режиссер Джеймс Кэмерон вошел в совет директоров компании в конце 2024-го

Из ограничений: ИИ пока что принимает промпты только на английском языке, не способен создавать реалистичные голоса, а эффективность генерации разнится в зависимости от жанра.

Бесплатно пользоваться моделью могут исследователи, любители и компании с годовым доходом менее $1 млн (более крупным бизнесам требуется приобретать корпоративную лицензию). Такое нововведение стало частью стратегии компании по обновлению продуктов после финансовых трудностей и смены руководства, включая назначение нового CEO и привлечение в совет директоров известного режиссера Джеймса Кэмерона.

сегодня 9:25

Подпишись на наш Twitter

и узнавай о новостях первым!
Написать комментарий
Ваш комментарий