Разбить массив на 2 выборки – обучающую и тестовую (80% и 20% от общего числа элементов соответственно) так, чтобы внутри каждой оказалось равное количество элементов каждого класса.
3. Нормализовать выборки, обеспечив нулевое среднее значение и дисперсию 1. Для этого подсчитать среднее значение и СКО для обучающей выборки и нормализовать тестовую, используя эти данные.
3*. Удалить выбросы в данных.
подробнее в документе