Ищу исполнителя для реализации автоматизации сбора сайтов и контактов на базе n8n, Apify и др.
Нужно реализовать парсинг Google по двум базам поисковых запросов:
– одна постоянная (список ключевых слов),
– вторая формируется автоматически из XML(база концертов и других мероприятий по городам). То есть нужно распарсить XML, найти новые данные(мероприятия, которые были добавлены с прошлого парсинга) для поисковых запросов.
Результаты необходимо обрабатывать и сохранять в Google Sheets, включая:
сбор доменов из топ-50 выдачи,
проверку на дубликаты с ранее собранными доменами,
сбор контактной информации (email или ссылка на форму обратной связи) с сайта и из whois.
Парсинг должен запускаться по расписанию:
– постоянная база запросов — раз в квартал,
– база из XML — раз в неделю.
Подробное ТЗ и примерами таблиц предоставлю.