Цель
Разработать интеллектуального помощника, который:
– Принимает аудиозаписи с конференций
– Автоматически загружает их в облако (Google Диск)
– Расшифровывает разговоры в чистый и читаемый текст
– Делит разговоры по партнёрам на основе голосовых меток
– Формирует итоговый отчёт в Google Docs с ключевыми блоками: компания, контакт, суть, договорённости, действия
Требуемый результат
Удобный способ загрузки аудиофайлов: через Telegram-бота или автоматическую папку в Google Диске. Поддержка форматов: .wav, .mp3, .m4a
Интеграция с Whisper API / OpenAI (или другим точным распознаванием речи)
Автоматическая транскрипция:
– Поддержка русского языка
– Очистка от слов-паразитов, «э-э», пауз, повторов
– Пунктуация, форматирование в абзацы
Система распознавания голосовых меток. :
«Компания: Ozon. Контакт: Иван. Обсуждаем партнёрскую программу. Начинаем диалог.»
Фраза должна быть распознана и оформлена как заголовок блока
Автоматическое формирование отчёта за день в Google Docs с блоками по каждому партнёру. Пример блока
Компания: Ozon
Контакт: Иван Петров, +7 (999) 123-45-67
Суть: Обсуждали партнёрскую модель ,
Договорённости: Отправить презентацию, договориться о Zoom-встрече
Следующие шаги: Подготовить предложение, связаться 17 мая
Telegram-уведомление с ссылкой на готовый Google Docs
Технологии (на выбор исполнителя)
Распознавание: Whisper API / Google Speech-to-Text
Telegram Bot API
Google Drive API
Google Docs API
Язык: Python, Node.js или другой подходящий стек
.