PYTHON ndcg指标

原创

mob64ca12f0cf8f 2024-09-14 04:19:20 ©著作权

文章标签 python Python ide 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者mob64ca12f0cf8f的原创作品，请联系作者获取转载授权，否则将追究法律责任

实现 Python NDCG 指标

NDCG（Normalized Discounted Cumulative Gain）是一种常用于信息检索的评估指标，可以反映推荐系统中排序的质量。在本文中，我们将逐步教你如何在 Python 中实现 NDCG 指标。以下是整个流程的步骤概述：

流程步骤概述

步骤	描述
1	导入所需的库
2	定义标准相关性和预测相关性
3	计算 DCG 值
4	计算理想 DCG 值
5	计算 NDCG 值
6	测试代码

甘特图

使用甘特图展示整个实现过程：

gantt
    title NDCG Implementation Timeline
    dateFormat  YYYY-MM-DD
    section 前期准备
    导入库          :a1, 2023-10-01, 1d
    定义相关性      :a2, after a1, 1d
    section 计算
    计算DCG        :b1, after a2, 1d
    计算理想DCG     :b2, after b1, 1d
    计算NDCG        :b3, after b2, 1d
    section 测试
    测试代码        :c1, after b3, 1d

步骤详解

第一步：导入所需的库

在 Python 中，我们将使用 NumPy 库进行数组和数学计算。

import numpy as np  # 导入 NumPy 库，用于数值计算

第二步：定义标准相关性和预测相关性

在这一步，我们需要定义真实的相关性评分和模型的预测相关性评分。

# 定义真实的相关性列表
true_relevance = [3, 2, 3, 0, 1, 2]  # 实际的相关性评分

# 定义模型预测的相关性列表
predicted_relevance = [1, 0, 2, 3, 0, 1]  # 模型预测的评分

第三步：计算 DCG 值

DCG 是累计增益的折扣版本，公式如下：

$$ DCG = \sum_{i=1}^{n} \frac{rel_i}{\log_2(i+1)} $$

以下是计算 DCG 的代码：

def dcg(relevance):
    """
    计算给定相关性列表的 DCG 值
    :param relevance: 相关性评分列表
    :return: DCG 值
    """
    return np.sum(relevance / np.log2(np.arange(2, len(relevance) + 2)))  # 按公式计算 DCG

第四步：计算理想 DCG 值

理想 DCG（IDCG）是指在理想的排序下计算的 DCG。

def idcg(relevance):
    """
    计算给定相关性列表的 IDCG 值
    :param relevance: 相关性评分列表
    :return: IDCG 值
    """
    sorted_relevance = sorted(relevance, reverse=True)  # 按降序排列相关性
    return dcg(sorted_relevance)  # 计算 IDCG

第五步：计算 NDCG 值

最后，NDCG 是通过将 DCG 除以 IDCG 来得到的。

def ndcg(true_relevance, predicted_relevance):
    """
    计算给定相关性列表的 NDCG 值
    :param true_relevance: 真实的相关性评分列表
    :param predicted_relevance: 模型预测的相关性评分列表
    :return: NDCG 值
    """
    # 计算 DCG 和 IDCG
    actual_dcg = dcg(predicted_relevance)
    ideal_dcg = idcg(true_relevance)

    # 计算 NDCG
    return actual_dcg / ideal_dcg if ideal_dcg > 0 else 0  # 避免除以零

第六步：测试代码

运用一些示例数据来测试我们的 NDCG 函数。

ndcg_value = ndcg(true_relevance, predicted_relevance)  # 计算 NDCG 值
print(f"NDCG 值为: {ndcg_value:.4f}")  # 打印结果

总结

通过上述步骤，我们详细解释了如何在 Python 中实现 NDCG 指标。我们定义了相关性评分、计算了 DCG 和 IDCG，并最终得出了 NDCG 值。希望这篇文章能帮助你更深入地理解 NDCG 的含义，以及在实际项目中如何应用它。如有任何疑问，欢迎随时联系我！

上一篇：MySQL数据库异地备份工具

下一篇：注册短信验证 java

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯