python logistics python logistics标准化数据

转载

attitude 2023-07-04 14:25:26

文章标签 python logistics 归一化数据转换方法 文章分类 Python 后端开发

数据的标准化(normalization)是将数据按比例缩放，使之落入一个小的特定区间。目前数据标准化方法有多种，归结起来可以分为直线型方法(如极值法、标准差法)、折线型方法(如三折线法)、曲线型方法(如半正态性分布)。不同的标准化方法，对系统的评价结果会产生不同的影响，然而不幸的是，在数据标准化方法的选择上，还没有通用的法则可以遵循。

常见的方法有：min-max标准化（Min-max normalization），log函数转换，atan函数转换，z-score标准化（zero-mena normalization，此方法最为常用），模糊量化法，均值归一化。本文只介绍min-max标准化、Z-score标准化方法、均值归一化、log函数转换、atan函数转换。

data = [1, 3, 4, 5, 2, 13, 23, 71, 11, 19, 9, 24, 38]

一、min-max标准化（Min-Max Normalization）

也称为离差标准化，是对原始数据的线性变换，使结果值映射到[0 - 1]之间。转换函数如下：

python logistics python logistics标准化数据_数据

from __future__ import print_function, division


# min-max标准化方法
data0 = [(x - min(data))/(max(data) - min(data)) for x in data]

二、Z-score标准化方法

这种方法给予原始数据的均值（mean）和标准差（standard deviation）进行数据的标准化。经过处理的数据符合标准正态分布，即均值为0，标准差为1，转化函数为：

python logistics python logistics标准化数据_python logistics_02

from __future__ import print_function
import math


# 均值
average = float(sum(data))/len(data)


# 方差
total = 0
for value in data:
    total += (value - average) ** 2
 
stddev = math.sqrt(total/len(data))


# z-score标准化方法
data1 = [(x-average)/stddev for x in data]

三、均值归一化

两种方式，以max为分母的归一化方法和以max-min为分母的归一化方法

python logistics python logistics标准化数据_归一化_03

from __future__ import print_function

# 均值
average = float(sum(data))/len(data)


# 均值归一化方法
data2_1 = [(x - average )/max(data) for x in data]

data2_2 = [(x - average )/(max(data) - min(data)) for x in data]

四、log函数转换方法

from __future__ import print_function

import math


# log2函数转换
data3_1 = [math.log2(x) for x in data]


# log10函数转换
data3_2 = [math.log10(x) for x in data]

五、atan函数转换方法

from __future__ import print_function

import math


# atan函数转换方法
data4 = [math.atan(x) for x in data]

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：awt中container用法 java java awt awterror

下一篇：bean java 理解 java bean技术

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯