1. Цель
Создать десктопное приложение для генерации коротких музыкальных фрагментов (15–40 сек) с помощью Stable Diffusion, обеспечивая полные авторские права на результат.
2. Выбор нейросети
Stable Diffusion (Audio) – используется аналогично Riffusion для генерации музыкальных спектрограмм.
3. Функционал
Приложение может быть GUI или консольным, должно включать:
[:2705] Ввод текста-промта (описывающего музыку).
[:2705] Выбор длины трека (15–40 сек).
[:2705] Кнопку «Генерировать».
[:2705] Интеграцию с Stable Diffusion:
Генерация спектрограммы (изображения).
Преобразование спектрограммы в музыку (WAV/MP3).
[:2705] Встроенный плеер для прослушивания результата.
[:2705] Кнопку «Сохранить».
4. Технические детали
Язык: Python (PyTorch, Stable Diffusion).
Поддержка: Windows.
Установка: readme с инструкцией по запуску.
Зависимости: torch, diffusers, librosa, PIL, soundfile
5. Результат
[:2705] Простое в использовании ПО:
Вводишь текст-промт [:1f3b6]
Выбираешь длину [:1f3bc]
Получаешь уникальный трек [:1f3a7]
[:2705] Музыка без авторских ограничений
[:2705] Исходники и документация
[:2705] Работа локально или через API