На главную

Парсинг каталога с двух сайтов

Парсинг данных с двух сайтов: Необходимо разработать скрипт для парсинга каталогов двух указанных сайтов. Для каждого товара из каталога нужно извлечь следующие данные: URL товара Заголовок (H1) Цену Формирование таблиц: Создать отдельные таблицы для каждого сайта, содержащие следующие столбцы: URL Название (H1) Цена Сохранить таблицы в удобном формате (например, CSV или Excel). Объединение данных: Сформировать общую таблицу, объединив данные из двух сайтов. Исключить все дубликаты товаров на основе уникальных признаков (например, URL или названия). Результат: Предоставить три таблицы: Таблица с данными по первому сайту. Таблица с данными по второму сайту. Общая таблица с объединенным каталогом без дубликатов. Дополнительные требования: Обеспечить корректность данных (проверка на отсутствие пустых значений или некорректных форматов). Учесть возможные различия в структуре сайтов при парсинге.