拓端数据tecdat|R语言基于温度对城市层次聚类、kmean聚类、主成分分析和Voronoi图可视化

原创

拓端tecdat 2022-11-14 19:53:42 ©著作权

©著作权归作者所有：来自51CTO博客作者拓端tecdat的原创作品，请联系作者获取转载授权，否则将追究法律责任

为了说明层次聚类技术和k-均值，我使用了了城市温度数据集，其中包括几个城市的月平均气温。

我们有15个城市，每月进行一次观测

boxplot(temp[,1:12],main="月平均温度")

拓端数据tecdat|R语言基于温度对城市层次聚类、kmean聚类、主成分分析和Voronoi图可视化_数据

由于方差看起来相当稳定，我们不会将这里的变量“标准化”，

> apply(月份,2,sd)

拓端数据tecdat|R语言基于温度对城市层次聚类、kmean聚类、主成分分析和Voronoi图可视化_r语言_02

为了得到一个层次聚类分析，使用实例

hclust(dist , method = "ward")

拓端数据tecdat|R语言基于温度对城市层次聚类、kmean聚类、主成分分析和Voronoi图可视化_聚类_03

另一种选择是使用

拓端数据tecdat|R语言基于温度对城市层次聚类、kmean聚类、主成分分析和Voronoi图可视化_数据_04

拓端数据tecdat|R语言基于温度对城市层次聚类、kmean聚类、主成分分析和Voronoi图可视化_r语言_05

在这里，我们用主成分分析将观察结果可视化。我们这里还有一个自动选择类的数目，这里是3个。我们可以得到组的描述

或直接

cutree(cah,3)

我们也可以自己可视化这些类，

可以绘制出这些簇的中心点

> points(PT$Dim.1,PT$Dim.2,pch=19)

如果我们在这些中心周围添加Voronoi集，我们看到的是中间的点，恰好是三个区域的交点

拓端数据tecdat|R语言基于温度对城市层次聚类、kmean聚类、主成分分析和Voronoi图可视化_r语言_06

要可视化这些区域，请使用Voronoi图，它又叫泰森多边形或Dirichlet图，它是由一组由连接两邻点直线的垂直平分线组成的连续多边形组成。

拓端数据tecdat|R语言基于温度对城市层次聚类、kmean聚类、主成分分析和Voronoi图可视化_数据_07

实际上，这三组（和这三个区域）也是我们用k-均值算法得到的，

由于我们有一些空间数据，我们可以在地图上把它们可视化

points(Long,Lati,col=groups.3)

拓端数据tecdat|R语言基于温度对城市层次聚类、kmean聚类、主成分分析和Voronoi图可视化_数据_08

或者，为了可视化这些区域，使用

拓端数据tecdat|R语言基于温度对城市层次聚类、kmean聚类、主成分分析和Voronoi图可视化_数据_09

拓端数据tecdat|R语言基于温度对城市层次聚类、kmean聚类、主成分分析和Voronoi图可视化_r语言_10

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯