爱数科(iDataScience)平台是一款数据科学科研和教学一体化平台,集成数十行业数千数据集、科研案例模板。帮助科研人员快速使用大数据和人工智能技术开展研究。支持高校开展大数据通识课程教学。帮助非专业人员进行数据分析和生成数据分析报告。使用拖拽式工具在线运行本案例请登录
本案例主要用于熟悉数据可视化中热力图组件的操作和运用。
1. 首尔自行车共享需求数据集
首先,读取数据集 首尔自行车共享需求数据集 ,该数据集包含在首尔自行车共享系统中每小时出租的公共自行车的数量,以及相应的天气数据和假日信息,共计14个属性,8760条数据。
2. 字段基本统计信息
查看字段基本统计信息。
由字段基本统计信息可以看到Seasons
季节、Holiday
假期、Functioning Day
功能日三个字段均是字符型数据,且不同取值个数较少。除了这三个字段和日期字段,其余字段均是连续数值型数据,在后面的可视化分析中,考虑将其中某些字段进行离散化,以便作热力图分析。
3. 不同季节每小时租车数量变化热力图
热力图,又称日历图。这是一种双变量图,由时间变量和另一种变量组成,其具体形式则是由小色块群有序且紧凑地以日历格式组成的图表,每个小色块代表时间变量,而小色块颜色则代表另一种变量,每个小色块都跟根据另一种变量的值进行颜色编码在这里根据data轴的数值进行编码
。其中,另一种变量的类型可以是定类/定序数据,也可以是定比/定距数据。作不同季节每小时租车数量变化热力图。在面板参数中,X轴选择Seasons
、Y轴选择Hour
、data轴选择Rented Bike Count
。作不同季节每小时租车数量变化热力图。在面板参数中,X轴选择Seasons
、Y轴选择Hour
、data轴选择Rented Bike Count
。
该图显示,冬季明显租用自行车数量较少,春季和夏季较多。并且,每天7-9,以及17-19两个时段,尤其是8和18两个时段,颜色最深,代表该时段每小时租用自行车数量最多。
4. 功能日和非功能日下每小时租车数量变化热力图
作功能日和非功能日下每小时租车数量变化热力图。在面板参数中,X轴选择Functioning Day
、Y轴选择Hour
、data轴选择Rented Bike Count
。
结果显示,功能日自行车租用数量较多,且在功能日,每天7-9,以及17-19两个时段,尤其是8和18两个时段每小时租用自行车数量最多的规律仍然存在。
5. (风速,降雨量、降雪量)等距离散化
生活常识,风速、降雨以及降雪情况都会影响自行车出行的方式,所以这里可以用热力图研究不同程度的风速、降雨量或者降雪量对自行车租用数量的影响。该数据集中风速、降雨量以及降雪量都采用连续型数值记录,为了使热力图更加清晰,便于分析,所以先采用等距离散化的方式,将这三个字段进行离散化处理。在面板参数中,处理列选择Wind speed (m\/s)
、Rainfall(mm)
和Snowfall (cm)
三个字段,分段数输入10
。
Wind speed (m/s)
、Rainfall(mm)
以及Snowfall (cm)
三个字段已经按照等距的方式划分为十个区间。
6. 不同风速下每小时租车数量变化热力图
作不同风速下每小时租车数量变化热力图。在面板参数中,X轴选择Wind speed (m/s)
、Y轴选择Hour
、data轴选择Rented Bike Count
。
热力图显示当风速达到7、8、9三个分段时,自行车租用数量明显减少。每天各时段自行车租用数量的规律仍然存在。
7. 不同降雨量下每小时租车数量变化热力图
作不同降雨量下每小时租车数量变化热力图。在面板参数中,X轴选择Rainfall(mm)
、Y轴选择Hour
、data轴选择Rented Bike Count
。
热力图显示,当降雨量达到3分段及以上时,自行车租用数量明显减少。且当降雨量在1分段及以上时,每天8和18两个自行车租用高峰时段的规律已经不明显甚至不存在。
8. 不同降雪量下每小时租车数量变化热力图
作不同降雪量下每小时租车数量变化热力图。在面板参数中,X轴选择Snowfall (cm)
、Y轴选择Hour
、data轴选择Rented Bike Count
。
热力图显示,当降雪量达到5分段及以上时,自行车租用数量明显减少,且当降雪量在1分段及以上时,每天8和18两个自行车租用高峰时段的规律已经不明显甚至不存在。
爱数科(iDataScience)平台是一款数据科学科研和教学一体化平台,集成数十行业数千数据集、科研案例模板。帮助科研人员快速使用大数据和人工智能技术开展研究。支持高校开展大数据通识课程教学。帮助非专业人员进行数据分析和生成数据分析报告。