Устранить задержки аудиопотоков (WebRTC, Node.js)

Цель: Снизить текущие задержки через QoS(?) и оптимизацию маршрутов(SFU?) Клиент ↔ STT (распознавание речи) → LLM → TTS (синтез) ↔ Клиент. Текущий стек: <ul><li>Бекенд на Node.js с передачей аудио через WebSocket.</li><li>STT (Speech-to-Text) → LLM → TTS (Text-to-Speech) ↔ Клиент</li><li>Аудиокодек: PCM16 (8 kHz) (без перекодирования, совместимость с браузерами, включая Safari).</li></ul> Текущее видение реализации проекта (вероятно оно может быть другое) 1. Анализ и проектирование: • Изучить текущую архитектуру (WebSocket + Node.js). • Предложить схему уменьшения задержек, через SFU для 1:1 аудиосвязи (не конференции!). 2. Настройка SFU-сервера: • Развернуть Mediasoup /Jitsi / OpenVidu, или облачное решение Daily / LiveKit, но мы там ограничены комнатами, возможно это не так). 3. Оптимизация задержек: • Устранить узкие места в цепочке (замер текущих задержек ~300-400 мс). • Протестировать работу в условиях высокой нагрузки. 4. Масштабирование: • Настроить горизонтальное масштабирование SFU (Docker/Kubernetes). • Добавить балансировку нагрузки между экземплярами STT/TTS. 5. Синхронизация с IP-телефонией: • Подготовить интеграцию с SIP (на будущее, но учесть в архитектуре). Требования к кандидату: <ul><li>Экспертиза в WebRTC (ICE/STUN/TURN, аудиопотоки).</li><li>Опыт с SFU (Mediasoup, Jitsi и.т.д) и аудиокодеками (PCM, Opus).</li><li>Навыки в Node.js (бекенд для медиасерверов).</li><li>Понимание сетей: RTP, QoS, туннелирование.</li></ul>

10.02.2025 в 22:19

Перейти к оригиналу