[:1f9fe] Техническое задание на парсинг сайта TFNY 2025
https://tfny2025.mapyourshow.com/8_0/explore/exhibitor-gallery.cfm?featured=false
[:1f3af] Цель:
Собрать информацию по всем участникам выставки (брендам) и выгрузить в виде таблицы (Google Sheets).
[:1f4cc] Что нужно собрать:
Для каждого бренда (экспонента) необходимо собрать:
Поле в таблице:
1) Название компании
2) Описание компании
3) Доп описание компании
4) Категории - Все категории (удалить цифры в скобках, через /, то есть Toys/Plush и тд )
5) Сайт - Ссылка на внешний сайт
6) Список брендов
7) Email
8) Контакты - Контактная информация, если доступна
9)Ссылка на бренд - Прямая ссылка на карточку бренда
10)Соцсети - ссылки Facebook, Instagram, LinkedIn и т.д., если указаны
[:1f501] Логика:
Перейти по ссылке на галерею брендов.
Пролистать/загрузить все карточки (используется динамическая подгрузка — нужно учесть).
Для каждой карточки перейти внутрь и собрать нужную информацию.
Вернуться к галерее и повторить для следующего бренда.
[:2699] Технические особенности:
Возможно потребуется имитация скроллинга (инфинити-лента).
Страница и карточки загружаются через JS — нужен парсер с поддержкой JavaScript (например, Puppeteer или Playwright).
Желательно предусмотреть задержки между запросами (1–3 сек) — чтобы не блокировали IP.
[:1f4e4] Выходной формат:
Google Sheets.
Отдельная строка — один бренд.
Чистая таблица без дублей и с корректной кодировкой.