Всем привет!
Задача, вкратце - написать машинное обучение для предсказаний колонки Target (движения цены эфириума вверх или вниз), с точностью 64%+ (точность = accuracy_score). В закрепе есть мой датасет, он 1 млн строк цены и объема торгов эфира на бирже Binance (open, high, low, close, volume) и так же там есть колонка Target, которую мы и пытаемся предсказать с точностью 64%+ (точность = accuracy_score).
Информация по датасету: coin= ETHUSDT, timeframe= 1m, Target= +-0.4%, first_row_Unix=1672531200000.0
------
Что вы можете:
1) Выбрать абсолютно любую модель или библиотеку для работы. Это может быть алгоритм, нейронка, ИИ, ЛЛМ, дерево, что угодно, что сможет достичь упомянутой точности.
2) Выбрать любое количество строк train/test. Единсетнные 2 правила, касаемо train/test: 1) между train и test должно быть МИНИМУМ 3000 строк. То-есть если мы обучаем на 0-100,000, то test будет самое раннее с 103,000 строчки. 2) сам test не может превышать 30,000 строк. Это обязательно.
3) Создать абсолютно любые индикаторы и колонки параметров для вашей модели.
------
Что нельзя делать ни при каких обстоятельствах:
1) Ни в коем случае, ни при каких обстоятельствах НЕЛЬЗЯ перемешивать данные! Данные на train, test, val (если используете) всегда должны идти в хронологическом порядке. Поэтому специально данные не перемешиваем, в train_test_split функцию shuffle ставим на False, пожалуйста, не забывайте.
2) Вы в полном праве переобучать или доучивать модель, по своему рассмотрению. Единсетнное правило, касаемо переобучения/переобучения, что между train и test должно быть МИНИМУМ 3000 строк. То-есть если мы обучаем на 0-100,000, то тест будем самое раннее с 103,000 строчки. Это обязательно.
3) Ни в коем случае, ни при каких обстоятельствах НЕЛЬЗЯ подавать колонку Target в качестве feature для алгоритма, даже как переменную и даже с задержкой! У вас полностью развязаны руки, чтобы сделать хоть 100 features (параметров) колонок, на основании технических индикаторов, например EMA, SuperTrend, Stochastic, RSI и так далее. Для создания доп. колонок у вас есть все необходимые данные - open, high, low, close, volume. Но полностью запрещено в какой-либо форме и в каком-либо виде интегрировать значения колонки Target в любую другую колонку и ее значения при создании features (параметров для модели).
------
На test и в вашу статистику подаются абсолютно все строки, по очереди, без исключения, вне зависимости от коэффициента уверенности модели или любых других факторов. То-есть если вы выбрали обучение на 150,000 строк, то у вас, в совокупности, будет 850,000 test строк. И вы должны сохранить в статистику предсказания абсолютно каждой из них. Допустим, опять же, что вы выбрали размер train 150,000 и размер test 10,000. Это значит, что в датасете на 1 миллион строк у вас будет 85 циклов переобучения и предсказания (по формуле (1,000,000 - train_size)/test_size)). Вы подсказываете 850,000 строк, разбитых на группы по 10,000 = 85 результатов accuracy_score. Вы должны сохранить все 85 accuracy_score и соблюсти 4 главные правила:
1) Минимальный accuracy_score их всех 85 (в данном примере 85, но у вас скорее всего будет другое количество циклов) должен быть - 0.57
2) Максимальное количество accuracy_score меньше чем 0.6 их всех 85 не должно превышать 20%
3) Усредненный (average) acucracy_score из всех 85 должен быть минимум 0.64
4) Максимальное количество последовательных accuracy_score меньше чем 0.6 их всех 85 не должно превышать 2. То-есть максимум может быть 2 accuracy_score подряд которые ниже чем 0.6.
------
**Если у вас возникли хоть какие-то вопросы касаемо данных правил, пожалуйста напишите мне, не молчите и не интерпретируйте по своему! Лучше я вам еще раз все объясню другими словами чтобы вопросов точно не было**
Это единственные 4 правила которые вы должны соблюсти, а в остальном вы полностью свободны в выборе: библиотеки, модели, гиперпараметров, индикаторов, их значений, количестве features и тд.
Первый человек, показавший мне код с точностью 64%+ и соблюдающий все 4 правила - получит гонорар 250тр и предложение дальнейшего сотрудничества по ставке 150тр/мес. Всем желаю удачи! На сайте отвечаю достаточно долго, поэтому для быстрой коммуникации предлагаю тг/ватсап, по запросу в лс.
Также хочу добавить, что я сотрудничаю ИСКЛЮЧИТЕЛЬНО по системе Безопасной Сделки на ФЛ. Пожалуйста не предлагайте оплату на-прямую через крипту и тд, такое я не принимаю!