Программное обеспечение для генерации музыки

1. Цель Создать десктопное приложение для генерации коротких музыкальных фрагментов (15–40 сек) с помощью Stable Diffusion, обеспечивая полные авторские права на результат. 2. Выбор нейросети Stable Diffusion (Audio) – используется аналогично Riffusion для генерации музыкальных спектрограмм. 3. Функционал Приложение может быть GUI или консольным, должно включать: [:2705] Ввод текста-промта (описывающего музыку). [:2705] Выбор длины трека (15–40 сек). [:2705] Кнопку «Генерировать». [:2705] Интеграцию с Stable Diffusion: Генерация спектрограммы (изображения). Преобразование спектрограммы в музыку (WAV/MP3). [:2705] Встроенный плеер для прослушивания результата. [:2705] Кнопку «Сохранить». 4. Технические детали Язык: Python (PyTorch, Stable Diffusion). Поддержка: Windows. Установка: readme с инструкцией по запуску. Зависимости: torch, diffusers, librosa, PIL, soundfile 5. Результат [:2705] Простое в использовании ПО: Вводишь текст-промт [:1f3b6] Выбираешь длину [:1f3bc] Получаешь уникальный трек [:1f3a7] [:2705] Музыка без авторских ограничений [:2705] Исходники и документация [:2705] Работа локально или через API

20.02.2025 в 23:43

Перейти к оригиналу