Разработать автоматизированное решение для извлечения цен и наименований товаров из текстовых прайс-листов, которые наши поставщики предоставляют через Telegram, и последующего выбора наилучшего предложения по цене.
<br>
1. Прием данных:<br>
• Формат прайс-листов: Поставщики предоставляют прайс-листы в виде текстовых сообщений в Telegram. Прайс-листы имеют неструктурированный формат (не являются Excel-таблицами). Формат может варьироваться, но в основном представляет собой текст со списками товаров и ценами.
<br>
* Реализовать Telegram-бота, который будет принимать сообщения с прайс-листами.
<br>* Альтернативно, предусмотреть возможность использования Telegram API для получения сообщений.
<br><br>2. Парсинг данных:
<br>• Технология: Использовать Python в качестве основного языка программирования.
<br>• Регулярные выражения (regex): Использовать regex для поиска и извлечения информации о ценах и наименованиях товаров.
<br>• Структурирование данных: Преобразовать извлеченные данные в структурированный формат (например, JSON или Python словари) для дальнейшей обработки.
<br>• Гибкость: Парсер должен быть достаточно гибким, чтобы обрабатывать различные форматы прайс-листов (с учетом возможных вариаций в разделителях, названиях товаров, форматах цен и т.д.).
<br>• Обработка ошибок: Предусмотреть механизм обработки ошибок в случае, если парсер не сможет извлечь данные из прайс-листа (например, логирование или сообщение об ошибке).
<br><br>3. Сравнение цен:
<br>• Алгоритм: Разработать алгоритм для сравнения цен на один и тот же товар от разных поставщиков.
<br>• Сопоставление товаров: Предусмотреть механизм для сопоставления товаров, даже если их названия у разных поставщиков немного отличаются.
<br>• Выбор наилучшего предложения: Алгоритм должен выбрать предложение с наименьшей ценой на каждый товар.
<br><br>4. Вывод результатов:
<br>• Формат: Результаты должны быть представлены в читаемом и понятном формате (например, таблица или список).
<br>• Уведомление: Отправлять результаты (список лучших предложений) в Telegram в виде сообщения (бота или пользователю).
<br>• Возможности:
<br>* Предусмотреть возможность вывода информации о товаре и поставщике.
<br>* Предусмотреть возможность экспорта результатов в файл (например, CSV).
<br><br>5. Технические требования:
<br>• Язык программирования: Python (версия 3.7 и выше).
<br>• Библиотеки: telebot или python-telegram-bot, requests, re, json (или другие по необходимости).
<br>• Документация: Разработчик должен предоставить документацию по работе с разработанным решением, включая инструкции по развертыванию и использованию.
<br>• Чистый код: Код должен быть чистым, хорошо структурированным и документированным (включая комментарии).<br>
• Масштабируемость: Разработанное решение должно быть масштабируемым, чтобы в будущем можно было добавлять поддержку новых форматов прайс-листов и функциональность.
<br>• Тестирование: Парсер должен быть протестирован на нескольких примерах прайс-листов, чтобы убедиться в его корректной работе.
<br>• Git: Использовать систему контроля версий Git для управления кодом.
Дополнительные требования:
<br>
• Предусмотреть возможность добавления новых поставщиков.
<br>• Предусмотреть возможность фильтрации товаров по категориям.
<br>• Предусмотреть возможность ручного вмешательства в результаты (если это необходимо).