На главную

Парсинг и валидация базы email со 140 тыс сайтов

Добрый день Есть база сайтов на 1С-Битрикс в форматах TXT/CSV, всего 147тыс уникальных рабочих доменов. Нужно спарсить с них все контактные email-адреса и качественно провалидировать их. В результате должен получиться CSV-файл, где будут столбцы: - сайт - валидные почты (через запятую) Невалидные почты можно удалить или поместить в отдельный файл, на ваше усмотрение. В комментариях просьба писать: 1. С помощью чего планируете парсить? 2. Каким ПО будете валидировать базу? Цена проекта обсуждаема, предлагайте свою. Важно качество работы, чтобы на выходе получить полную базу валидных адресов.