一、分析思路
前面已通过python+tableau实现对淘宝用户行为数据的分析
此次使用MySQL实现同等分析操作。分析思路依旧:
二、数据背景
数据来源阿里天池:https://tianchi.aliyun.com/dataset/dataDetail?dataId=649
三、数据清洗
①数据拆分
出于电脑性能考虑,源数据过大,利用python拆分3000000条数据进行分析。
②导入数据库
设定存储列不为空值,保证数据无缺失值。
导入后数据结果为
③根据时戳值转化类型,新增datetime列,将datetime列拆分dates列和hours列
拆分结果为
④删除异常数据
可知超出时间范围的数据均为异常值,删除。
四、数据分析
1.流失和转化分析
①pv点击量到购买量的转化
导出数据用tableau展示各环节转化率
②uv访客量到购买量的转化
导出数据用tableau展示各环节的转化率
2.用户行为的时间模式分析
①用户该时期每天活跃度
导出数据用tableau展示结果
②用户一天各时间段活跃度
将hours列设置成小时单位
结果为
按各时间段统计活跃度
导出数据用tableau展示结果
3.商品和商品种类分析
①商品种类点击量和购买量之间的关系
按转化率降序排序结果为
导出数据用tableau展示相关性
②商品类目前10点击量和购买量
③商品点击量和购买量之间的关系
按转化率降序排列结果为
导出数据用tableau展示相关性
④商品前10点击量和购买量
4.用户价值分析
对用户分层
①统计每个用户的购买次数
②统计每个用户最近购买时间
③将结果导出新建“用户购买次数”,“用户最近购买时间”表
④根据购买次数对用户分层
⑤根据用户最近购买时间对用户分层
⑥构建RFM模型综合评估用户
导出用户价值分类表,可以根据RF值找出各层用户,实现精准对策。
五、总结
利用MySQL+Tableau可同样实现Python数据分析操作。