Проект заключается в разработке интеллектуальной системы для автоматизированного поиска и анализа учебных материалов, предназначенной для предоставления точных ответов на тесты, используя библиотеку и лекции по дисциплинам. Основной задачей является создание системы, которая будет обеспечивать поиск и анализ вопросов на основе учебных материалов, с точностью ответов не менее 90%.
Задачи для разработчика:
Автоматический поиск ответов:
Система должна обеспечивать мгновенный поиск ответов на тестовые вопросы на основе загруженных учебных материалов, включая лекции и библиотеку по дисциплинам.
В случае отсутствия точных данных в базе, система должна подключать внешние источники (Google, Yandex) для расширения информации.
Интеграция нейросетей:
Использование ChatGPT для анализа сложных запросов, требующих контекстуального понимания и интерпретации.
Обработка мультимедийных данных:
Поддержка преобразования мультимедийных данных (видео, аудио, изображения) в текст с помощью OCR и распознавания речи, чтобы пользователь мог найти информацию, даже если она представлена в видеоформате или аудиоформате.
Поиск по ключевым словам и тайм-кодам:
Разработка системы для фильтрации данных по дисциплинам, темам, типам материалов и меткам времени в видео, чтобы пользователи могли быстро находить нужную информацию.
Поддержка составных и многозначных запросов:
Обработка запросов, которые включают несколько аспектов, предоставление различных интерпретаций ответа и пояснений.
Интерактивность и обратная связь:
Возможность интерактивного взаимодействия с системой для получения мгновенных ответов, а также сбор обратной связи от пользователей для улучшения точности ответов.
Этапы разработки:
Проектирование базы данных:
Создание структуры базы данных для хранения различных типов учебных материалов, включая текст, видео и изображения.
Интеграция с облачными хранилищами для хранения больших файлов и векторным хранилищем для текстов.
Парсинг и загрузка данных:
Разработка автоматизированного процесса парсинга учебных материалов из библиотек и личных кабинетов пользователей с регулярным обновлением данных.
Создание графа знаний:
Построение графа знаний для выявления взаимосвязей между понятиями, дисциплинами и темами.
Интеграция внешних поисковых систем и нейросетей:
Настройка API для работы с внешними поисковыми системами и нейросетями для обработки сложных запросов.
Разработка пользовательского интерфейса:
Создание интуитивно понятного интерфейса для поиска и просмотра учебных материалов, включая возможность отправки запросов для получения ответов.
Алгоритмы ранжирования и фильтрации источников:
Разработка системы ранжирования, которая будет приоритизировать внутренние данные перед внешними источниками и фильтрация для исключения ненадежных данных.
Команда:
Для реализации проекта потребуется 3 человека:
2 бекенд разработчика:
Один для разработки базы данных и интеграции с облачными хранилищами, второй — для работы с нейросетями и разработки парсинга.
1 фронтенд разработчик:
Разработка интерфейса, интеграция с API и создание интуитивно понятного пользовательского интерфейса.
Требования к результату:
Система должна обеспечивать точные и релевантные ответы на тестовые вопросы из учебных материалов, с точностью не менее 90%. Требования к проекту:
Интуитивно понятный интерфейс для пользователей.
Поддержка мультимедийных данных и семантического поиска.
Высокая точность обработки запросов, включая сложные и многозначные вопросы.
Интеграция с внешними источниками и нейросетями.
Адаптация системы на основе обратной связи пользователей.
Соблюдение стандартов безопасности данных и подготовка документации.