Создать скрипт (программный модуль) для сбора и анализа открытой информации из интернета. Основные задачи скрипта:
Поиск по поисковым системам
По заданному ключевому слову (например название компании) получать ссылки из поисковой выдачи до 10-й страницы.
Сохранять заголовок, описание и ссылку в базу данных (БД).
Анализ Telegram
Иметь возможность анализировать контент только тех каналов и чатов, к которым у меня есть доступ (публичные или мои собственные).
Ищем упоминания заданных ключевых слов за последний месяц, сохраняем ссылки на сообщения, коротко описываем содержимое.
Формирование отчёта
На основе сохранённых данных структурировать упоминания.
Формировать базовые «портреты» (обобщённые профили), если найдены упоминания о нескольких схожих именах или названиях.
Выдавать краткое резюме по каждому «портрету»: какие источники упоминают, какие ключевые моменты зафиксированы.
Требования:
Язык и платформа: обсуждаемы (Python, PHP и т.д.).
База данных: любая (MySQL, PostgreSQL или удобный для вас вариант).
Проект должен использовать только публичные и общедоступные источники, не собирать личные или приватные данные.
Результат — скрипт/программа + инструкция, как настроить и запустить.
Что хочу получить на выходе:
Рабочий скрипт/приложение, который я могу запустить на своём сервере (или локально).
Файлы проекта + инструкция по установке и настройке.