На главную

Структурировать базу в 120 000 записей запчастей

Нам нужно очистить и структурировать базу в 120 000 записей запчастей: объединить дубли и взаимозаменяемые артикулы, выбрать «master»-SKU и подготовить итоговый CSV для Airtable. Задачи: Написать скрипты на Python/Pandas для нормализации полей (артикулы, описания). Удалить точные дубли (drop_duplicates) и реализовать fuzzy-matching (RapidFuzz). Построить граф связей (NetworkX), выделить connected components. Для каждого кластера выбрать «мастер-запись» по заданным метрикам (частота источника, длина описания, наличие фото). Сгенерировать итоговый файл с колонками: master_sku, aliases, description, characteristics, sources, photo_urls. Требования: Уверенный Python, опыт с pandas, rapidfuzz, networkx. Знание алгоритмов кластеризации и фраззи-сравнения. Опыт работы с таблицами >50 000 строк. Умение писать чистый, документированный код. Условия: Удалённо, гибкий график. Фикс-прайс за этап или почасовая оплата. Срок реализации: 2–3 недели.

Нужен дизайн для оформления подарочных коробок

Необходимо разработать дизайн, оформление для подарочных коробок. И в дополнение к этому дизайн для одной открытки, в том же стиле. Есть...

Сбор информации о предприятиях Казахстана

Создать базу данных предприятий Казахстана которые занимаются металлообработкой или используют металлообрабатывающие инструменты. Так же составить список фирм занимающихся...

Полная разработка бренд бука

Добрый день! Во вложении ТЗ цена договорная 2025-05-16