На главную

Парсинг сайтов-каталогов

<span style="color:rgb(61,66,77);font-size:15px;background-color:rgb(255,255,255);">Доброго времени суток! Цена указана условная, прошу ознакомиться с ТЗ ниже и оценить ваш труд исходя из сложности. Важно - высылайте, пожалуйста, вдумчивые ответы, визитки обычно не "в кассу"))</span><br><br>Дано.<br>8 сайтов каталогов/агрегаторов, данных не более 500-1000 контактов, вероятность пересечения до 90%. Сайты имеют вид либо статичного каталога, либо ленты постов посвященных контрагенту которого мы парсим. <br><br>Задачи: <br><br><ol><li>Совместно выявить графы (категории), которые являются критерием для фильтра на сайте (контакты, котегория и пр ) Нужно согласовать со мной финальный вид шапки и после одобрения, дальнейшие шаги: <br></li><li>Объединить те, которые повторяются в двух и более сайтах;</li><li>Для сайтов со структурой выдачи контрагентов в виде постов.* Сделать итоговые количественные подсчёты какое количество раз сайт который парсим ссылался на внешний ресурс контрагента. (вытекающая задача подсчёт количество отсылок) </li><li>Для сайтов со структурой выдачи контрагентов в виде постов.* Произвести ранжирование, поднимая в ТОП строку с большим количеством обращений к нему, по убывания, (суммируем выдачи на 5 сайтах) </li><li>Проверка валидности, если ссылка на офер контрагента битая, нужно проверить работает ли сайт в целом, те вторая валидация проверка работоспособности домена. </li></ol> Итоговый результат нужен в формате Exel<br><br><br><br>

Парсинг каталога в битрикс из xml

Описание задачи Необходимо разработать процесс обработки файлов от поставщиков, содержащих информацию о товарах и их торговых предложениях (цвет, стекло, размер, комплектация),...