Нужно разработать серверную часть сервиса для mock-интервью IT-специалистов. Вопросы загружаются из базы (PostgreSQL/SQLite) и частично генерируются через OpenAI API. Затем они конвертируются в аудио (TTS, например, Deepgram), пользователь отвечает голосом, речь распознается (STT API), и ответы анализируются OpenAI API для динамической подстройки вопросов. В конце формируется отчет. Бэкенд на Python (FastAPI/Flask) или Node.js (Express), аутентификация через JWT/OAuth. В первой версии делаем базовый голосовой процесс без визуального агента.
Я сделала пробный вариант у себя локально, выглядит примерно так: https://www.youtube.com/watch?v=NamMmCltuGA&t=1s
За промты и файн тюнинг отвечает заказчик
Предложите цену и сроки и пожалуйста, напишите про свой релевантный опыт.