Техническое задание для обработки базы данных
Отфильтровать базу контактов, оставив только актуальные и целевые данные.
Удалить дубли, мусорные данные и привести таблицу к удобному формату для дальнейшего использования.
Задачи:
Оставить только следующие столбцы:
Название
Тип
Регион
Населенный пункт
Адрес
Телефоны
Сотовый
Email
Сайт
Vk.com
Заголовок
Описание
Разнести данные в отдельных столбцах:
Удалить записи, в которых совпадают телефоны и/или email.
Добавить новый столбец "ИНН":
Найти ИНН организаций по названию компании, региону и адресу (или через открытые базы данных, такие как ЕГРЮЛ/ЕГРИП).
Добавить новый столбец "Выручка за 2023 год":
Найти данные о выручке компаний (по ИНН) в открытых источниках (для ИП можно не указывать, так как такой информации как правило нет в открытом доступе, для ООО обязательно). Формат числовой без текстовых знаков.
Проверить на актуальность контакты:
Отметить контакты, которые не действуют (телефон не активен, сайт не работает, email не отвечает).
Обратить внимание на целевую аудиторию:
Добавить столбец "Целевой контакт (Да/Нет)" и проставить метки, если данные подходят под следующие критерии:
Компания связана с покраской или полным циклом строительства домов.
У компании есть работающий сайт, действующий email и активные телефоны. (Если сайт не указан, руководствоваться остальными пунктами)
Выручка компании за предыдущий год более 10 млн рублей
Компания существует более 2х лет.
Оптимизировать базу для фильтрации