Сбор и обработка данных с сайта Dili360 через подборку Baidu<br>Dili360 – тревел-сайт<br><br>Собрать тексты с сайта Dili360 (через подборку по ссылку в Baidu), извлечь актуальную туристическую лексику, статьи и ключевые фразы, чтобы предоставить данные для анализа. Все дальнейшие анализы частотности, структуры предложений и стиля текста выполнит нейросеть (ChatGPT).<br><br>Этапы работы:<br>1. Сбор ссылок из подборки Baidu<br>2. Сбор текстов с сайта Dili360<br>3. Очистка данных<span><br>4. Структурирование данных<span><br></span></span><br><br>Итоги работы:<br> • Все релевантные тексты с сайта собраны.<br> • Итоговый объем данных составляет не менее 5000 уникальных фраз.<br> • Данные очищены и структурированы.<br> • Файлы подготовлены для загрузки и анализа.<br><br>Во вложении подробное ТЗ<br><br><br><br><br><br><br>