На главную

Разработка алгоритма классификации текста (Python)

Цель: Создание системы автоматической классификации текстов по заданным категориям. Описание задачи: Необходимо разработать алгоритм на Python, который будет обрабатывать текстовые данные и присваивать каждой записи одну из предварительно определенных категорий. На входе: CSV файл с 50,000 текстовыми единицами. (Данные изначально не размечены). Ожидаемые результаты: 1. Готовый алгоритм (скрипт/функция и тд.) на python (возможно готовые решения), который принимает текстовую запись на входе и возвращает категорию. 2. Понимания полной цепочки действий для достижения результата: - Консультация (20-30 минут по Skype) или предоставление инструкции. 3. Дополнительные рекомендации, скрипты и советы, которые могут способствовать успешной реализации проекта. Готовность к работе: - Готов работать итеративно: открытость к обсуждению промежуточных результатов и улучшению алгоритма на каждом этапе. - Срок выполнения не является жестким: готовность к диалогу и гибкому планированию сроков. Дополнительная информация: Приветствуется использование современных методов машинного обучения и библиотек Python (например, scikit-learn, TensorFlow, Keras и др.). Обязательно объяснение выбранного подхода и инструментов.