Цель: Создание системы автоматической классификации текстов по заданным категориям.
Описание задачи:
Необходимо разработать алгоритм на Python, который будет обрабатывать текстовые данные и присваивать каждой записи одну из предварительно определенных категорий.
На входе: CSV файл с 50,000 текстовыми единицами. (Данные изначально не размечены).
Ожидаемые результаты:
1. Готовый алгоритм (скрипт/функция и тд.) на python (возможно готовые решения), который принимает текстовую запись на входе и возвращает категорию.
2. Понимания полной цепочки действий для достижения результата:
- Консультация (20-30 минут по Skype) или предоставление инструкции.
3. Дополнительные рекомендации, скрипты и советы, которые могут способствовать успешной реализации проекта.
Готовность к работе:
- Готов работать итеративно: открытость к обсуждению промежуточных результатов и улучшению алгоритма на каждом этапе.
- Срок выполнения не является жестким: готовность к диалогу и гибкому планированию сроков.
Дополнительная информация: Приветствуется использование современных методов машинного обучения и библиотек Python (например, scikit-learn, TensorFlow, Keras и др.). Обязательно объяснение выбранного подхода и инструментов.