python计算加权标准差

原创

mob649e81673fa5 2024-09-06 04:32:22 ©著作权

©著作权归作者所有：来自51CTO博客作者mob649e81673fa5的原创作品，请联系作者获取转载授权，否则将追究法律责任

如何计算加权标准差

在数据分析中，加权标准差是一个重要的概念，用于衡量数据点的分散程度，尤其当数据点的重要性不同时。本文将教你如何在 Python 中实现加权标准差。首先，我们会梳理整个过程，接着逐步实现。

流程概述

以下是实现加权标准差的步骤：

步骤	描述
1	导入必要的库
2	定义数据和权重
3	计算加权平均数
4	计算每个数据点与加权平均数的偏差
5	计算加权偏差的平方
6	计算加权标准差

步骤详解

1. 导入必要的库

在这一部分，我们需要导入 NumPy，它是一个用于进行数学计算的强大库。

import numpy as np  # 导入 NumPy 库

2. 定义数据和权重

这里我们需要定义数据和对应的权重。

data = np.array([10, 20, 30, 40, 50])   # 定义数据数组
weights = np.array([1, 2, 3, 4, 5])      # 定义对应的权重

3. 计算加权平均数

加权平均数是通过将每个数据点乘以其权重再除以权重总和得到的。

weighted_mean = np.sum(data * weights) / np.sum(weights)  
# 计算加权平均数

4. 计算每个数据点与加权平均数的偏差

我们需要计算每个数据点与加权平均数之间的偏差。

deviations = data - weighted_mean  
# 计算每个数据点的偏差

5. 计算加权偏差的平方

接着，我们计算偏差的平方，并乘以相应的权重。

weighted_squared_deviations = weights * (deviations ** 2) 
# 计算加权偏差的平方

6. 计算加权标准差

最后，我们可以通过加权偏差的平方的总和除以权重的总和来得到加权方差，然后开平方得到加权标准差。

weighted_variance = np.sum(weighted_squared_deviations) / np.sum(weights)  # 计算加权方差
weighted_std = np.sqrt(weighted_variance)  # 计算加权标准差

关系图

为了帮助你更好地理解加权标准差的计算过程，下面展示了该过程中的各项之间的关系：

erDiagram
    DATA {
        float value
    }

    WEIGHTS {
        float weight
    }

    WEIGHTED_MEAN {
        float mean
    }

    DEVIATIONS {
        float deviation
    }

    WEIGHTED_SQUARED_DEVIATIONS {
        float squared_deviation
    }

    WEIGHTED_VARIANCE {
        float variance
    }

    WEIGHTED_STD {
        float std
    }

    DATA ||--o{ WEIGHTS : has
    WEIGHTED_MEAN ||--o{ DEVIATIONS : derived_from
    DEVIATIONS ||--o{ WEIGHTED_SQUARED_DEVIATIONS : leads_to
    WEIGHTED_SQUARED_DEVIATIONS ||--o{ WEIGHTED_VARIANCE : contributes_to
    WEIGHTED_VARIANCE ||--o{ WEIGHTED_STD : results_in

完整代码示例

将以上步骤整合，我们得到以下代码：

import numpy as np  # 导入 NumPy 库

data = np.array([10, 20, 30, 40, 50])   # 定义数据数组
weights = np.array([1, 2, 3, 4, 5])      # 定义对应的权重

weighted_mean = np.sum(data * weights) / np.sum(weights)  # 计算加权平均数

deviations = data - weighted_mean  # 计算每个数据点的偏差

weighted_squared_deviations = weights * (deviations ** 2)  # 计算加权偏差的平方

weighted_variance = np.sum(weighted_squared_deviations) / np.sum(weights)  # 计算加权方差
weighted_std = np.sqrt(weighted_variance)  # 计算加权标准差

print("加权标准差为：", weighted_std)  # 输出结果