数组如何按列归一化python

原创

mob64ca12e58adb 2023-10-07 11:38:18 ©著作权

©著作权归作者所有：来自51CTO博客作者mob64ca12e58adb的原创作品，请联系作者获取转载授权，否则将追究法律责任

数组如何按列归一化（归一化）

归一化是一种常用的数据预处理方法，在机器学习和数据分析中经常用到。它将数据按照一定的比例缩放，使得所有特征的取值范围都在相同的区间内。这样做的好处是可以消除不同特征之间的量纲差异，避免因为数据尺度不同而给模型训练带来的不便。在数组处理中，按列归一化是指将数组的每一列进行归一化操作。本文将介绍如何使用Python实现按列归一化。

1. 归一化的方法

常见的归一化方法包括最小-最大归一化和Z-score归一化。最小-最大归一化将数据线性缩放到[0, 1]的范围，公式如下：

$$X_{\text{norm}} = \frac{X - \text{min}(X)}{\text{max}(X) - \text{min}(X)}$$

Z-score归一化则将数据转化为均值为0，标准差为1的分布，公式如下：

$$X_{\text{norm}} = \frac{X - \text{mean}(X)}{\text{std}(X)}$$

其中，$X$为原始数据，$X_{\text{norm}}$为归一化后的数据。

2. Python代码示例

下面是一个示例，演示如何使用Python对数组按列归一化。

import numpy as np

def min_max_normalize(data):
    min_vals = np.min(data, axis=0)
    max_vals = np.max(data, axis=0)
    normalized = (data - min_vals) / (max_vals - min_vals)
    return normalized

def z_score_normalize(data):
    mean_vals = np.mean(data, axis=0)
    std_vals = np.std(data, axis=0)
    normalized = (data - mean_vals) / std_vals
    return normalized

# 原始数据
data = np.array([[1, 2, 3],
                 [4, 5, 6],
                 [7, 8, 9]])

# 最小-最大归一化
min_max_normalized = min_max_normalize(data)
print("Min-Max normalized data:")
print(min_max_normalized)

# Z-score归一化
z_score_normalized = z_score_normalize(data)
print("Z-score normalized data:")
print(z_score_normalized)

上述代码中，我们使用了NumPy库进行数组操作。min_max_normalize函数实现了最小-最大归一化，z_score_normalize函数实现了Z-score归一化。通过调用这两个函数，可以分别得到两种归一化方法下的结果。

3. 流程图

下面是按列归一化的流程图：

flowchart TD
    A[开始] --> B[输入原始数据]
    B --> C[最小-最大归一化]
    C --> D[输出归一化数据]
    B --> E[Z-score归一化]
    E --> D
    D --> F[结束]

流程图中，开始节点表示算法开始执行的地方，结束节点表示算法执行结束的地方。输入原始数据后，可以选择执行最小-最大归一化或Z-score归一化。最终，算法输出归一化后的数据。

4. 总结

本文介绍了如何使用Python对数组按列归一化。归一化是一种常用的数据预处理方法，可以消除不同特征之间的量纲差异，使得数据更加适合用于机器学习和数据分析。在Python中，可以使用NumPy库进行数组操作，通过编写相应的归一化函数来实现按列归一化。

上一篇：MySQL 视图跟存储过程

下一篇：python语言中括号注释可以不加吗

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯