Создать скрипт на Python для работы с аудио-файлами

Написать скрипт на Python, которому на вход подаётся аудиозапись в формате .mp3 (запись телефонного разговора на русском языке), где условно в левом наушнике - голос робота, а в правом наушнике - голос абонента на другой стороне. Необходимо разделить эти два канала и отдельно перевести каждый в текст (очень желательно без использования сторонних API, но в крайнем случае можно с использованием API OpenAI), чтобы на выходе получился диалог в формате: Alice (00:01): Здравствуйте! Alice (00:03): Как ваши дела? Bob (00:04): Здравствуйте. Всё хорошо. ... Цена указана приблизительная, присылайте ваши варианты.

16.12.2024 в 19:44

Перейти к оригиналу