Написать скрипт на Python, которому на вход подаётся аудиозапись в формате .mp3 (запись телефонного разговора на русском языке), где условно в левом наушнике - голос робота, а в правом наушнике - голос абонента на другой стороне.
Необходимо разделить эти два канала и отдельно перевести каждый в текст (очень желательно без использования сторонних API, но в крайнем случае можно с использованием API OpenAI), чтобы на выходе получился диалог в формате:
Alice (00:01): Здравствуйте!
Alice (00:03): Как ваши дела?
Bob (00:04): Здравствуйте. Всё хорошо.
...
Цена указана приблизительная, присылайте ваши варианты.