Устранить задержки аудиопотоков (WebRTC, Node.js)

Цель: Снизить текущие задержки через QoS(?) и оптимизацию маршрутов(SFU?) Клиент ? STT (распознавание речи) ? LLM ? TTS (синтез) ? Клиент.Текущий стек:<ul><li>Бекенд на Node.js с передачей аудио через WebSocket.</li><li>STT (Speech-to-Text) ? LLM ? TTS (Text-to-Speech) ? Клиент</li><li>Аудиокодек: PCM16 (8 kHz) (без перекодирования, совместимость с браузерами, включая Safari).</li></ul>Текущее видение реализации проекта (вероятно оно может быть другое)1. Анализ и проектирование:• Изучить текущую архитектуру (WebSocket + Node.js).• Предложить схему уменьшения задержек, через SFU для 1:1 аудиосвязи (не конференции!).2. Настройка SFU-сервера:• Развернуть Mediasoup / Jitsi / OpenVidu, или облачное решение Daily / LiveKit, но мы там ограничены комнатами, возможно это не так).3. Оптимизация задержек:• Устранить узкие места в цепочке (замер текущих задержек ~300-400 мс).• Протестировать работу в условиях высокой нагрузки.4. Масштабирование:• Настроить горизонтальное масштабирование SFU (Docker/Kubernetes).• Добавить балансировку нагрузки между экземплярами STT/TTS.5. Синхронизация с IP-телефонией:• Подготовить интеграцию с SIP (на будущее, но учесть в архитектуре).Требования к кандидату:<ul><li>Экспертиза в WebRTC (ICE/STUN/TURN, аудиопотоки).</li><li>Опыт с SFU (Mediasoup, Jitsi и.т.д) и аудиокодеками (PCM, Opus).</li><li>Навыки в Node.js (бекенд для медиасерверов).</li><li>Понимание сетей: RTP, QoS, туннелирование.</li></ul>

10.02.2025 в 22:27

Перейти к оригиналу