У меня есть аудио файлы объемом до 1 гб, которые нужно регулярно распознавать. Сервисы по распознаванию предлагают тарифы сильно больше чем яндекс апи (9 руб. час).
Мне нужно сделать программу / бот/ любой способ чтобы без любых навыков программирования удобно и просто загружать файлы в яндекс апи и получать расшифрованный текст. Если есть простые способы без создания программы отправлять файлы в яндекс.апи - тоже вариант решения.
Мне нужно проанализировать какие требования должны быть к программе с точки зрения пользователя (составить ТЗ для вас) и сделать такую программу. Она должна быть полностью готова к запуску без каких либо манипуляций с моей стороны (я не программист!).
функции:
- выбор папки или 1 файла для загрузки в mp3 другие поддерживаемые форматы
- кнопка отправки/загрузки
- какой то способ отслеживать статус по каждому файлу и получать текстовый файл. Распознавание в асинхронном режиме занимает до 24 часов
- автоматическое сохранение в заданную папку текста или ручное?
- должна отправляться команда на нормализацию текста (Добавление заглавной буквы в начале предложения и в именах собственных. Добавление знаков пунктуации, (см. описание в яндексе)
- после выключения компьютера и запуска программа должна запоминать последнее состояние - т.е. чтобы можно было открыть программу - проверить статус распознания и закрыть
- ?? возможно какие то еще функции, требования, которые вы подскажите для удобства выполнения задачи.
https://yandex.cloud/ru/docs/speechkit/stt/speaker-labeling