Добрый день
Есть база сайтов на 1С-Битрикс в форматах TXT/CSV, всего 147тыс уникальных рабочих доменов. Нужно спарсить с них все контактные email-адреса и качественно провалидировать их. В результате должен получиться CSV-файл, где будут столбцы:
- сайт
- валидные почты (через запятую)
Невалидные почты можно удалить или поместить в отдельный файл, на ваше усмотрение.
В комментариях просьба писать:
1. С помощью чего планируете парсить?
2. Каким ПО будете валидировать базу?
Цена проекта обсуждаема, предлагайте свою. Важно качество работы, чтобы на выходе получить полную базу валидных адресов.