На главную

Разработать модели нейронных сетей (NLP)

1. Определение спикера аудиозаписи <br>Требования: Использовать HMM-based audio keyword generation для определения голоса спикеров по тембру, разбивки аудио на фрагменты и сформирования транскрипций через whisper <a href="https://github.com/openai/whisper">https://github.com/openai/whisper</a> Выходом должен быть список спикеров (спикер 1, спикер 2 и тд) с соответствующими тайм-кодами и обозначениями в тексте, чтобы каждый фрагмент речи был связан с конкретным спикером.<br><br> 2. Обработка текста (пунктуация, грамматика) <br>Обеспечить автоматическую корректировку текста, улучшив его качество за счет исправления пунктуационных и грамматических ошибок после транскрибации. <a href="https://github.com/orgail/ml_punctuate">https://github.com/orgail/ml_punctuate</a> <a href="https://huggingface.co/ai-forever/RuM2M100-1.2B">https://huggingface.co/ai-forever/RuM2M100-1.2B</a> <a href="https://huggingface.co/ai-forever/RuM2M100-1.2B">https://huggingface.co/ai-forever/RuM2M100-1.2B</a> Требования: Разработать или подключить стороннюю модель для обработки текста , которая будет работать с уже транскрибированным текстом. Коррекция должна охватывать исправление пунктуации, орфографии, грамматических ошибок и других мелких стилистических ошибок. Обработка текста должна быть реализована в формате API, принимая на вход текст с тайм-кодами и возвращая исправленный текст с сохранением исходной структуры. Возможность адаптации модели под разные языки (при необходимости). <br> 3. Генерация (суммаризация) текста <br>Добавить возможность автоматически генерировать краткое содержание транскрибированного текста. Требования: Использовать модель для суммаризации текста (https://www.kaggle.com/code/singhabhiiitkgp/text-summarization-using-lstm). Функция должна принимать на вход текст (с тайм-кодами) и возвращать краткую суть в виде текста. Суммаризация должна учитывать контекст и быть способной работать с текстами разного объема и сложности. Реализовать гибкие настройки, позволяющие пользователю задавать длину итогового текста. Whisper возвращает тайм-коды для транскрибации, и все вышеуказанные функции должны работать с учетом этих тайм-кодов, не нарушая хронологической структуры текста. <br> Функционал должен быть интегрирован в общую систему обработки аудиозаписей, чтобы после транскрибации автоматически выполнялись: корректировка текста, определение спикеров и генерация суммаризации. API: Все функции должны быть реализованы через API с возможностью простого расширения и подключения других модулей в будущем. Тестирование: Необходимо провести тестирование всех функций на различных типах данных (разные по качеству и длине аудиозаписи) для проверки их корректной работы. Дополнительные требования: Документация к каждому компоненту (как на уровне кода, так и для конечных пользователей). Логи успешных/ошибочных операций. Возможность расширения функционала в будущем.

Торговый робот на основе искусственного интеллекта на языке python.

Требуется разработка торгового робота на основе искусственного интеллекта. Нужно чтобы торговый робот обучался на исторических данных, исходя из заложенного алгоритма и...

Разработка сайта на NetCat для компании

Нужен разработчик сайта на NetCat О проекте: Компания «Еврофабрика» — дистрибьютор импортного упаковочного оборудования для тепличных хозяйств, мясной и молочной...

Постинг Reels и сторис

ВАЖНО: Задание для исполнителей из СНГ или стран Европы. Требуется базовое оформление сторис и постинг рилс в Инстаграм. 1-2 рил в...