一、K-means聚类

K均值聚类是一种常见的无监督学习算法,在modeler中无监督体现在设置“类型”节点并读取值时,没有一个字段的角色是目标。它的原理是将数据分成k个簇,每个簇的中心是该簇中所有点的平均值(中心点不一定是现存的点)。在聚类过程中,每个点被分配到与其最近的中心点所在的簇中,直到簇的中心不再发生变化或发生的变化可以忽略不计。

K均值聚类算法的优点是简单易懂、易于实现,并且可以处理大规模数据集。但是,它需要手动指定簇的个数k,并且对初始簇中心的选择比较敏感,容易收敛到局部最优解。在modeler中,k值的选择方法较为简单粗暴,一般选取3~6簇(2簇太少,6簇以上太多)逐个尝试,哪个k值效果好选择哪个。

spss怎么做nemenyi检验_spss怎么做nemenyi检验

二、RFM模型

RFM模型是衡量客户价值和客户创造利益能力的重要工具和手段,由三个指标构成:

  1. Recency:最近一次消费距离现在的时间,该值越小越好。
  2. Frequency:某段时间内的消费次数,这个值越大越好。
  3. Monetary:某段时间内的消费金额,消费金额越多越好。

RFM本质上是一种用三个分类维度,找判断标准方法;通过三个维度的组合计算,能判定出用户的好坏,然后采取对应措施。因此,RFM模型的真正意义在于:这是一种可以从交易数据反推用户价值的方法。

三、数据处理

3.1数据类型介绍

本数据集一共包含9个字段,541909条记录,其中,数据的起始日期是2010-12-01,结束日期是2011-12-10.

spss怎么做nemenyi检验_kmeans_02

3.2数据抽取

在modeler中,选择“记录选项”中的“RFM”抽取,固定日期填写数据集中的结束日期,标识填写CustomerID,日期填写InvoiceDate,值填写TotalPrice。

spss怎么做nemenyi检验_spss怎么做nemenyi检验_03

输入一个表格观察抽取后的数据,发现modeler已经自动计算了RFM的初始值。

spss怎么做nemenyi检验_字段_04

3.3数据转化

在“字段选项”中选择“RFM分析”,在设置中填入RFM的初始值,将RFM的分级数调整为3,可以实现数据类型的转化(数值型→分类型)。

spss怎么做nemenyi检验_零售_05

同样的,输入一个表格观察RFM分析后的结果,发现modeler对客户进行了RFM评分(近因评分×3+频率评分×10+货币评分×1),实际上已经完成了客户细分,在这个表格中,我们重点关注RFM评分为333的客户,因为这样的客户是最近的一次购买间隔较短、购买频率较高且购买金额较多的重点客户。

spss怎么做nemenyi检验_零售_06

3.4创建“客户价值”计算字段

为了更进一步地进行客户细分,以便针对不同客户价值的客户进行精细化营销,我们创建一个“客户价值”的计算字段,并在此基础上进行聚类分析。在“字段选项”中选择“导出”,在设置中将导出字段命名为客户价值,点击公式编辑器,按照R、F、M分别赋予2、5、3的权重(权重可以根据实际需要自行调整)进行加权和,得到客户价值字段。

spss怎么做nemenyi检验_字段_07

将生成的客户价值节点连接到“类型”,选择“读取值”,可以看到modeler生成了一个客户价值字段,它的取值范围是【10,30】。

spss怎么做nemenyi检验_kmeans_08

将“类型”节点连接到K-Means模型中,在字段中选择“使用定制字段分配”,输入客户价值,在模型中聚类数选择4并运行。

spss怎么做nemenyi检验_spss怎么做nemenyi检验_09

spss怎么做nemenyi检验_字段_10

四、结果解读

4.1模型概要

在模型概要中,我们重点关注模型的轮廓系数,当轮廓系数大于0.5时,说明聚类效果较优。

spss怎么做nemenyi检验_零售_11

4.2聚类结果

聚类结果显示,聚类-1的平均客户价值为28.30,占比为33.3%,聚类-2的平均客户价值为10.63,占比为22.1%。

spss怎么做nemenyi检验_字段_12

4.3方差分析

为了进一步地验证组内非常相似、而组间存在显著的差异,我们在“输出”中选择“平均值”字段,填入对应的分组字段和测试字段,点击运行。

spss怎么做nemenyi检验_聚类_13

将聚类1与其他组别进行比较,结果显示不论是R值、F值还是M值,聚类1与其他组都存在显著的差异。

spss怎么做nemenyi检验_kmeans_14

将聚类结果连接到表格,可以发现每一个客户都被加入了相对应的聚类标签,这有助于营销人员针对不同的客户群置顶相应的营销策略。

spss怎么做nemenyi检验_字段_15