Domain suspended or not configured

If you are the administrator and believe this is an error on our side, please check your BunnyCDN account configuration or contact customer support.

Машинное обучение для предсказаний движений цены ETHUSDT,... | fseek.ru
На главную

Машинное обучение для предсказаний движений цены ETHUSDT, с точностью 64%+ | Python, ML (Бюджет: 250000 ₽, для всех)

Всем привет! Задача, вкратце - написать машинное обучение для предсказаний колонки Target (движения цены эфириума вверх или вниз), с точностью 64%+ (точность = accuracy_score). В закрепе есть мой датасет, он 1 млн строк цены и объема торгов эфира на бирже Binance (open, high, low, close, volume) и так же там есть колонка Target, которую мы и пытаемся предсказать с точностью 64%+ (точность = accuracy_score). Информация по датасету: coin= ETHUSDT, timeframe= 1m, Target= +-0.4%, first_row_Unix=1672531200000.0 ------ Что вы можете: 1) Выбрать абсолютно любую модель или библиотеку для работы. Это может быть алгоритм, нейронка, ИИ, ЛЛМ, дерево, что угодно, что сможет достичь упомянутой точности. 2) Выбрать любое количество строк train/test. Единсетнные 2 правила, касаемо train/test: 1) между train и test должно быть МИНИМУМ 3000 строк. То-есть если мы обучаем на 0-100,000, то test будет самое раннее с 103,000 строчки. 2) сам test не может превышать 30,000 строк. Это обязательно. 3) Создать абсолютно любые индикаторы и колонки параметров для вашей модели. ------ Что нельзя делать ни при каких обстоятельствах: 1) Ни в коем случае, ни при каких обстоятельствах НЕЛЬЗЯ перемешивать данные! Данные на train, test, val (если используете) всегда должны идти в хронологическом порядке. Поэтому специально данные не перемешиваем, в train_test_split функцию shuffle ставим на False, пожалуйста, не забывайте. 2) Вы в полном праве переобучать или доучивать модель, по своему рассмотрению. Единсетнное правило, касаемо переобучения/переобучения, что между train и test должно быть МИНИМУМ 3000 строк. То-есть если мы обучаем на 0-100,000, то тест будем самое раннее с 103,000 строчки. Это обязательно. 3) Ни в коем случае, ни при каких обстоятельствах НЕЛЬЗЯ подавать колонку Target в качестве feature для алгоритма, даже как переменную и даже с задержкой! У вас полностью развязаны руки, чтобы сделать хоть 100 features (параметров) колонок, на основании технических индикаторов, например EMA, SuperTrend, Stochastic, RSI и так далее. Для создания доп. колонок у вас есть все необходимые данные - open, high, low, close, volume. Но полностью запрещено в какой-либо форме и в каком-либо виде интегрировать значения колонки Target в любую другую колонку и ее значения при создании features (параметров для модели). ------ На test и в вашу статистику подаются абсолютно все строки, по очереди, без исключения, вне зависимости от коэффициента уверенности модели или любых других факторов. То-есть если вы выбрали обучение на 150,000 строк, то у вас, в совокупности, будет 850,000 test строк. И вы должны сохранить в статистику предсказания абсолютно каждой из них. Допустим, опять же, что вы выбрали размер train 150,000 и размер test 10,000. Это значит, что в датасете на 1 миллион строк у вас будет 85 циклов переобучения и предсказания (по формуле (1,000,000 - train_size)/test_size)). Вы подсказываете 850,000 строк, разбитых на группы по 10,000 = 85 результатов accuracy_score. Вы должны сохранить все 85 accuracy_score и соблюсти 4 главные правила: 1) Минимальный accuracy_score их всех 85 (в данном примере 85, но у вас скорее всего будет другое количество циклов) должен быть - 0.57 2) Максимальное количество accuracy_score меньше чем 0.6 их всех 85 не должно превышать 20% 3) Усредненный (average) acucracy_score из всех 85 должен быть минимум 0.64 4) Максимальное количество последовательных accuracy_score меньше чем 0.6 их всех 85 не должно превышать 2. То-есть максимум может быть 2 accuracy_score подряд которые ниже чем 0.6. ------ **Если у вас возникли хоть какие-то вопросы касаемо данных правил, пожалуйста напишите мне, не молчите и не интерпретируйте по своему! Лучше я вам еще раз все объясню другими словами чтобы вопросов точно не было** Это единственные 4 правила которые вы должны соблюсти, а в остальном вы полностью свободны в выборе: библиотеки, модели, гиперпараметров, индикаторов, их значений, количестве features и тд. Первый человек, показавший мне код с точностью 64%+ и соблюдающий все 4 правила - получит гонорар 250тр и предложение дальнейшего сотрудничества по ставке 150тр/мес. Всем желаю удачи! На сайте отвечаю достаточно долго, поэтому для быстрой коммуникации предлагаю тг/ватсап, по запросу в лс. Также хочу добавить, что я сотрудничаю ИСКЛЮЧИТЕЛЬНО по системе Безопасной Сделки на ФЛ. Пожалуйста не предлагайте оплату на-прямую через крипту и тд, такое я не принимаю!