Scikit-learn 数据预处理之标准化StandardScaler

原创

Shen Liang 2023-02-20 16:41:15 博主文章分类：机器学习 ©著作权

文章标签 sklearn python 数据标准差缩放 文章分类 JavaScript 前端开发

©著作权归作者所有：来自51CTO博客作者Shen Liang的原创作品，请联系作者获取转载授权，否则将追究法律责任

Scikit-learn 数据预处理之标准化StandardScaler

1 声明

本文的数据来自网络，部分代码也有所参照，这里做了注释和延伸，旨在技术交流，如有冒犯之处请联系博主及时处理。

2 StandardScaler简介

StandardScaler当数据(x)按均值(μ)中心化后，再按标准差(σ)缩放，数据就会服从为均值为0，方差为1的标准正态分布，该过程叫数据标准化(Standardization，又称Z-score normalization)。

应用场景：在分类、聚类、通过距离计算相似性时、使用PCA技术进行降维时。

3 StandardScaler

计算方法:

Scikit-learn 数据预处理之标准化StandardScaler_sklearn

import pandas as pd
from sklearn.preprocessing import StandardScaler
data = pd.DataFrame(
    {
        'a':[1,2,3],
        'b':[5,6,6],
        'c':[9,100,2]
    }
)

#标准化(StandardScaler)，对列进行特征转换。
scale_x = StandardScaler()
scale_data = scale_x.fit_transform(data)
print(scale_data)
print("均值:",round(scale_data.mean()))
print("标准差:",round(scale_data.std()))

Scikit-learn 数据预处理之标准化StandardScaler_python_02