spss怎么做nemenyi检验

转载

mob6454cc6ff2b9 2024-09-11 01:13:28

文章标签 spss怎么做nemenyi检验 kmeans 聚类零售字段 文章分类 机器学习人工智能

一、K-means聚类

K均值聚类是一种常见的无监督学习算法，在modeler中无监督体现在设置“类型”节点并读取值时，没有一个字段的角色是目标。它的原理是将数据分成k个簇，每个簇的中心是该簇中所有点的平均值（中心点不一定是现存的点）。在聚类过程中，每个点被分配到与其最近的中心点所在的簇中，直到簇的中心不再发生变化或发生的变化可以忽略不计。

K均值聚类算法的优点是简单易懂、易于实现，并且可以处理大规模数据集。但是，它需要手动指定簇的个数k，并且对初始簇中心的选择比较敏感，容易收敛到局部最优解。在modeler中，k值的选择方法较为简单粗暴，一般选取3~6簇（2簇太少，6簇以上太多）逐个尝试，哪个k值效果好选择哪个。

spss怎么做nemenyi检验_spss怎么做nemenyi检验

二、RFM模型

RFM模型是衡量客户价值和客户创造利益能力的重要工具和手段，由三个指标构成：

Recency：最近一次消费距离现在的时间，该值越小越好。
Frequency：某段时间内的消费次数，这个值越大越好。
Monetary：某段时间内的消费金额，消费金额越多越好。

RFM本质上是一种用三个分类维度，找判断标准方法；通过三个维度的组合计算，能判定出用户的好坏，然后采取对应措施。因此，RFM模型的真正意义在于：这是一种可以从交易数据反推用户价值的方法。

三、数据处理

3.1数据类型介绍

本数据集一共包含9个字段，541909条记录，其中，数据的起始日期是2010-12-01，结束日期是2011-12-10.

spss怎么做nemenyi检验_kmeans_02

3.2数据抽取

在modeler中，选择“记录选项”中的“RFM”抽取，固定日期填写数据集中的结束日期，标识填写CustomerID，日期填写InvoiceDate，值填写TotalPrice。

spss怎么做nemenyi检验_spss怎么做nemenyi检验_03

输入一个表格观察抽取后的数据，发现modeler已经自动计算了RFM的初始值。

spss怎么做nemenyi检验_字段_04

3.3数据转化

在“字段选项”中选择“RFM分析”，在设置中填入RFM的初始值，将RFM的分级数调整为3，可以实现数据类型的转化（数值型→分类型）。

spss怎么做nemenyi检验_零售_05

同样的，输入一个表格观察RFM分析后的结果，发现modeler对客户进行了RFM评分（近因评分×3+频率评分×10+货币评分×1），实际上已经完成了客户细分，在这个表格中，我们重点关注RFM评分为333的客户，因为这样的客户是最近的一次购买间隔较短、购买频率较高且购买金额较多的重点客户。

spss怎么做nemenyi检验_零售_06

3.4创建“客户价值”计算字段

为了更进一步地进行客户细分，以便针对不同客户价值的客户进行精细化营销，我们创建一个“客户价值”的计算字段，并在此基础上进行聚类分析。在“字段选项”中选择“导出”，在设置中将导出字段命名为客户价值，点击公式编辑器，按照R、F、M分别赋予2、5、3的权重（权重可以根据实际需要自行调整）进行加权和，得到客户价值字段。

spss怎么做nemenyi检验_字段_07