На главную

Агент для игры Hearthstone (CORL, offline обучение)

Ищу исполнителя для создания агента, играющего в Hearthstone, на основе готового набора данных (в формате JSON). Данные содержат эпизоды с состояниями игры, действиями и результатами. Цель: Обучить агента принимать разумные действия в новых ситуациях, опираясь на поведение из датасета. Обучение должно учитывать, что: - Данные фиксированы, и генерация новых эпизодов невозможна - Поведение агента не должно сильно отклоняться от поведения в данных Желаемые навыки: Опыт с обучением с подкреплением (Reinforcement Learning) — особенно офлайн-RL (CORL, KL-регуляризация и др.) Допустимы и альтернативные подходы (например, имитационное обучение, поведенческие модели, etc), если они работают лучше Умение разрабатывать и отлаживать ML-модели или системы принятия решений. Открыт к любым предложениям по методологии. Спасибо!

Доработка приложения C# с БД

Есть разработанное на С# в Visual studio приложение для создания автоматизированных тестов для образовательного учреждения. К нему привязана БД. Приложение запускается...

Иллюстрация к релизу новой версии ПО

Здесь полное описание задачи с примерами: https://docs.google.com/document/d/1-x3HZMwx6BymEvwtXng1tBBfyjFp-xpcVjnVR78jQTA/edit?usp=sharing Если будут вопросы, все подскажу....

Лого и айдентика

Лого и айдентика для бренда chevah design 1. Фундамент проекта Тип: Студия (предметный дизайн) + личный бренд + концепт-продукты Миссия: Эстетика,...