ТЗ примерно выглядит так:
[:1f7e2] Дается видео в тг - обработка нейросетью 1
[:1f7e2] Дается текст - обработка нейросетью 1
[:1f7e2] Дается видео + полученное аудио - обработка нейросетью 2
Для обработки используются 2 нейросети - для аудио и для видео.
Пишите, пожалуйста, сразу с конкретикой по срокам и как это будет реализовано Вами. Так же что необходимо для решения данной задачи (сервер и т.д.)