На главную

Разработка ПО C++/Python: обработка документов с ИИ

Разработка программы для автоматизированной обработки документов Требуется создать приложение для Windows, которое будет автоматизировать обработку текстовых документов, таблиц и сканов. Основной функционал включает: Загрузка и обработка файлов: Поддержка форматов: PDF, DOC/DOCX, XLS/XLSX, PNG, JPG, TXT. Возможность перетаскивания файлов в окно загрузки. Автоматическое разделение многостраничных документов (например, PDF) на части. Обработка документов: Распознавание текста из сканов с использованием OCR (например, Tesseract). Определение типа документа по ключевым словам (госконтракты, отчёты, резюме и т.д.). Автоматическое извлечение ключевых данных (даты, суммы, стороны договора). Интеграция с API нейросети: Передача данных в API для выполнения задач (например, краткий пересказ, анализ данных). Получение результатов от API и отображение их в структурированном виде. Интерфейс: Минималистичный дизайн на базе Qt: Слева список задач (обработка контрактов, отчётов, резюме и т.д.). Справа — зона загрузки файлов. Внизу — область вывода результатов с кнопками для сохранения документов или уточнения деталей. Функции редактирования: Настройка промтов для API (доступно только администратору). Возможность внесения изменений в регулярные выражения и настройки обработки. Технические требования: Основной функционал реализуется на C++ (Qt), дополнительные задачи — на Python. Хранение временных данных и настроек в JSON-файлах.