ТЗ:
Рабочий парсер (на Python), который будет автоматически собирать данные из открытых и надежных источников по списку компаний из Excel-файла `компании.xlsx`.
Задачи парсера:
Для каждой компании из списка необходимо получить и структурировать следующую информацию:
1. Актуальный сайт компании:
* Если сайт компании существует - указать его.
* Если сайта нет - указать альтернативную страницу с описанием (например, на `spark-interfax.ru`, `list-org.com`, `yandex.ru/maps` и т.п.).
* Если ни сайт, ни альтернативное описание не найдены - указать прочерк `"-"`.
2. Отрасль и род деятельности компании:
* По возможности определить отрасль или краткое описание бизнеса.
* В случае отсутствия этой информации - указывать коды ОКВЭД.
3. Применимость силиконовых изделий:
* Определить, что теоретически компания могла бы использовать из силиконовой продукции (трубки, уплотнители, формы, медицинские компоненты, изоляция, и пр.).
* Формулировка - краткая, но осмысленная.
Результаты в Excel/CSV.
Использовать только проверенные и известные ресурсы.
Можно использовать поисковый парсинг через Google или API поисковиков при необходимости.