Scikit-learn 数据预处理之归一化MinMaxScaler
原创
©著作权归作者所有:来自51CTO博客作者Shen Liang的原创作品,请联系作者获取转载授权,否则将追究法律责任
Scikit-learn 数据预处理之归一化MinMaxScaler
1 声明
本文的数据来自网络,部分代码也有所参照,这里做了注释和延伸,旨在技术交流,如有冒犯之处请联系博主及时处理。
2 MinMaxScaler简介
MinMaxScaler当数据(x)按照最小值中心化后,再按极差(最大值 - 最小值)缩放,数据移动了最小值个单位,并且会被收敛到[0,1]之间,该过程叫数据归一化(Normalization,又称Min-Max Scaling)
应用场景:在不涉及距离度量、协方差、数据不符合正态分布、异常值较少时。
3 MinMaxScaler
计算公式(A为某个属性或者特征):
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
data = pd.DataFrame(
{
'a':[1,2,3],
'b':[5,6,6],
'c':[9,100,2]
}
)
print(data.values)
#归一化(MinMaxScaler)
min_max_scaler = MinMaxScaler(feature_range=[0,1])
min_max_scaler_data=min_max_scaler.fit_transform(data)
print(min_max_scaler_data)
注: 1 默认缩放到0到1之间。可通过feature_range指定区间。
2 这里的数据矩阵形式如下: