На главную

Машинное обучение для предсказаний движений цены ETHUSDT, с точностью 57%+ | Python, ML (Бюджет: 250000 ₽, для всех)

Всем привет! Задача - написать машинное обучение для предсказаний колонки Target (движения цены эфириума вверх или вниз), с точностью 57%+ (точность, я имею ввиду accuracy_score от sklearn). В закрепе будет датасет, 1 млн строк цены и объема торгов эфира на бирже Binance (open, high, low, close, volume) и так же там есть колонка Target, которую мы и пытаемся предсказать с точностью 57%+ (accuracy_score). Информация по датасету: coin= ETHUSDT, timeframe= 1m, Target= +-0.9%, first_row_Unix=1668746340000 ------ Что вы можете: 1) Выбрать абсолютно любую модель или библиотеку для работы. Это может быть самописный алгоритм, нейронка, ИИ, ЛЛМ, дерево, что угодно, что сможет достичь упомянутой точности. 2) Выбрать любое количество строк train/test. Единсетнные 2 правила, касаемо train/test: 1) между train и test должно быть МИНИМУМ 500 строк. То-есть если мы обучаем на 0-100,000, то test будет самое раннее с 100,500 строчки. 2) сам test не может превышать 35,000 строк за 1 цикл. Это обязательно. 3) Создать абсолютно любые индикаторы и колонки параметров для вашей модели. ------ Что НЕЛЬЗЯ делать ни при каких обстоятельствах: 1) Ни в коем случае, ни при каких обстоятельствах НЕЛЬЗЯ перемешивать данные! Данные на train, test, val (если используете валидацию) всегда должны идти в хронологическом порядке. Поэтому специально данные не перемешиваем, в train_test_split функцию shuffle ставим на False, пожалуйста, не забывайте. 2) Вы в полном праве переобучать или доучивать модель, по своему рассмотрению. Единсетнное правило, касаемо переобучения/переобучения, что между train и test должно быть МИНИМУМ 500 строк. То-есть если мы обучаем на 0-100,000, то тест будем самое раннее с 100,500 строчки. Это обязательно. 3) Ни в коем случае, ни при каких обстоятельствах НЕЛЬЗЯ подавать колонку Target в качестве feature для алгоритма, даже как переменную в функции и даже с задержкой! У вас полностью развязаны руки, чтобы сделать хоть 1000 features (параметров) колонок, на основании технических индикаторов, например EMA, SuperTrend, Stochastic, RSI и так далее. Для создания дополнительных колонок у вас есть все необходимые данные - open, high, low, close, volume. Но вам полностью запрещено в какой-либо форме и в каком-либо виде интегрировать значения колонки Target в любую другую колонку и ее значения при создании features (параметров для модели). ------ На test и в вашу статистику подаются абсолютно все строки, по очереди, без исключения, вне зависимости от коэффициента уверенности модели или любых других факторов. То-есть если вы выбрали обучение на 150,000 строк, то у вас, в совокупности, будет 850,000 test строк. И вы должны сохранить в статистику предсказания абсолютно каждой из них. Допустим, опять же, что вы выбрали размер train 150,000 и размер test 10,000. Это значит, что в датасете на 1 миллион строк у вас будет 85 циклов переобучения и предсказания по формуле: (1,000,000 - train_size)/test_size. Вы подсказываете 850,000 строк, разбитых на группы по 10,000 = 85 результатов accuracy_score. Вы должны сохранить все 85 accuracy_score и соблюсти 4 главные правила: 1) Минимальный accuracy_score их всех 85 (в данном примере 85, но у вас скорее всего будет другое количество циклов) должен быть - 0.53 2) Максимальное количество accuracy_score меньше чем 0.55 их всех 85 не должно превышать 20% 3) Усредненный (average) acucracy_score из всех 85 должен быть минимум 0.57 4) Максимальное количество последовательных accuracy_score меньше чем 0.55 их всех 85 не должно превышать 2. То-есть максимум может быть 2 accuracy_score подряд которые ниже чем 0.55. ------ **Если у вас возникли хоть какие-то вопросы касаемо данных правил, пожалуйста напишите мне, не молчите и не интерпретируйте по своему! Лучше я вам еще раз все объясню другими словами чтобы вопросов точно не было** Это единственные 4 правила которые вы должны соблюсти, а в остальном вы полностью свободны в выборе: библиотеки, модели, гиперпараметров, индикаторов, их значений, количестве features и тд. Первый человек, показавший мне код с точностью 57%+ и соблюдающий все 4 правила - получит гонорар 250тр и предложение дальнейшего сотрудничества по ставке 150тр/мес. Всем желаю удачи! На сайте отвечаю достаточно долго, поэтому для быстрой коммуникации предлагаю тг/ватсап, по запросу в лс. P.S 1) Я сотрудничаю ИСКЛЮЧИТЕЛЬНО по системе Безопасной Сделки на ФЛ. Пожалуйста, не предлагайте оплату на-прямую через крипту и тд, такое я не принимаю! 2) Пожалуйста, разработку по рейту не предлагать, авансы, предоплаты и тд - лесом! Есть деньги, есть задача - показываете результат, получаете бабки. Все максимально просто. 3) Если у вас получилось соблюсти любые 3 из 4 правил, то я готов рассмотреть ваше решение, но не факт, что оно мне подойдет. В общем, я думаю, мы договоримся.

Специалист по холодным продажам (Outreach)

Наша команда специализируется на контент-маркетинге и ищет специалиста по холодным продажам (Outreach) [:1f4cd]Чем предстоит заниматься? — Поиск новых клиентов через email...

Создание сервера для GTA 5

Создание сервера для GTA 5 на платформе RageMP или FiveM. Необходима консультация и создание сервера способного выдерживать высокий онлайн, с наличием...

Сложные иллюстрации для сайта на тильде и оформить сайт

Сложные иллюстрации для сайта на тильде и оформить сайт. Иллюстрации будут состоять из фото товара и описанного в тз оформления. Для...