На главную

Переписать скрипт парсинг данных веб-сайтов на Node.js

На данный момент система, построенная на Python с применением FastAPI POST запрос и nodriver libratry , выполняет парсинг HTML-страниц, используя форматы данных, такие как json-ld, opengraph, rdfa и microformat и указаные селекторы. Необходимо разработать схожую функциональность (получение данныех используя форматы json-ld, opengraph, rdfa и microformat, получение данных с указанных селекторов) на базе NestJS или ExpressJS, применяя Puppeteer для получения данныех в headless mode для анализа HTML-страниц. В новом решении требуется внедрить обработку исключений, добавить систему логирования для фиксации событий и завернуть приложение в Docker-образ. 60-70% кода готово, необходимо доделать