Задача такая:
1. Есть 3 больших таблицы, нужно сделать одну - найти пересечения компаний и дополнить информацию недостающими столбцами.
Берем за основу 1й файл (main) - сохраняем его структуру и группировку по отраслям. Дополняем имеющиеся в нем строки данными (добавляя столбцы), которые нашли в 2х других базах: , база дублгис и база атису.
Найденные данные из атису добавляем к main путем добавления столбцов справа.
Далее тоже самое с дублгис. База дублгис представляет собой архив с 1700 таблицами. Берем из нее только РФ.
Я вижу что можно найти пересечения по телефонам, предварительно приведя все телефоны в базах в единый формат.
Цель - свести все в общую базу.
2. Далее нужно отфильтровать общую базу по следующим критериям:
Оборот от 700 млн до 7 млрд в год (столбец Выручка (тыс. руб.));
Дата регистрации должна быть не менее 2 лет (столбец Год регистрации).
Численность сотрудников не менее 10 человек (столбец Численность сотрудников (чел.)).
Цель - выгрузить отфильтрованную базу.
Файлы предоставлю после согласования.
Сделать нужно за пару дней.