说明:
本数据集共有104万条左右数据,数据为淘宝APP2014年11月18日至2014年12月18日的用户行为数据,共计6列字段,列字段分别是: user_id:用户身份,脱敏 item_id:商品ID,脱敏 behavior_type:用户行为类型(包含点击、收藏、加购物车、支付四种行为,分别用数字1、2、3、4表示) user_geohash:地理位置 item_category:品类ID(商品所属的品类) time:用户行为发生的时间
说明:
本数据集共有104万条左右数据,数据为淘宝APP2014年11月18日至2014年12月18日的用户行为数据,共计6列字段,列字段分别是: user_id:用户身份,脱敏 item_id:商品ID,脱敏 behavior_type:用户行为类型(包含点击、收藏、加购物车、支付四种行为,分别用数字1、2、3、4表示) user_geohash:地理位置 item_category:品类ID(商品所属的品类) time:用户行为发生的时间
2种常用分析方法的应用
基于Hive的淘宝用户行为数据分析本文将通过阿里云天池提供的淘宝用户行为
项目运行了三年了,流水表主表数据已经达到4kw以上所以最近项目开始时不时的出现问题,主要体现在以下方面:1.客户端经常出现查询超时。 1.1 mybatis分页查询出现问题。 1.2 项目里面一些统计或者趋势图开始出现问题 &
举报文章
请选择举报类型
补充说明
0/200
上传截图
格式支持JPEG/PNG/JPG,图片不超过1.9M