На главную

Разработка MVP: LLM base document search

Необходимо разработать MVP приложения по сортировке документов исходя из их релевантности запросу (из самих документов какую то информацию на данном этапе извлекать не надо). Запрос делается на естественном языке.<br><br>Важно: <br>1. реализовать функционал до-обучения на базе обратной связи<br>2. необходим поиск с учетом полного контекста запроса (не по ключевым словам). Но и в лоб сравнивать embedding тоже не надо<br>3. документы длиной 20-30 тыс токенов <br><br>Стек: <br>OS: Ubuntu<br>DB: Векторная, на усмотрение разработчика<br>Python + torch + transformers / hugging face<br>Fast API<br>+ любой UI (web) для демонстрации