用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。用户画像建立的过程就是添加相应的标签,在数据挖掘领域称为标签化。标签是通过对用户信息分析而得到的高度精炼的特征标识。

        比如唯品会、淘宝可根据用户的购物习惯,买了什么产品,根据产品的属性,最终都会形成不同标签,例如高低价值、男女等标签,用这些标签就可以形成用户画像,这就是贴标签的过程。

用户画像就是贴标签_java


       综合而言,添加标签方法主要有4种:

       (1)固有基本属性标签

       比如人口统计学的属性信息,这些信息包括性别、年龄、职业、学历、籍贯、婚姻、收入、房产等信息。如果你有客户的身份证号码,你就可以提取出用户的籍贯、出生日期、性别等信息,具体可参见 

【用户画像必备技能】手把手教你提取隐藏在身份证里的秘密

       (2)通过基础信息处理得到标签

        比如说根据你的出生日期就可以推算出星座、生肖、性格等,因为我们知道不同的星座会有不同的性格或者做事风格,如处女座追求完美。再例如你家庭地址在北京二环内,那么可能就被打上一个标签——“土豪”或者其他标签。

       (3)通过用户行为推测标签

       例如用户购买了高尔夫球用品,你可能就是高端商务人士或老板,那么可能会被贴上高收入、高端等标签。再例如如果购买了卫生巾的客户,那么可能就被贴上女性、非孕妇等标签,这就是根据用户的一些行为特征推测添加的标签。

用户画像就是贴标签_java_02

       (4)数据挖掘建模输出标签

       例如从几个指标综合对用户进行聚类分析,最终会得到不同用户群体,每个群体就有一个标签,属于什么类;再比如流失预测模型,模型最终输出流失概率得分,我们可以根据流失概率得分的高低,划分为高流失用户、中流失用户、低流失用户、不流失用户等标签,这些都是最终得到一个标签,也就是前面所说的标签化、贴标签。

       综合而言,贴标签不一定要用到数据挖掘高大上的方法,简单通过一个有业务价值的指标,如消费额、消费频次都能得到非常有业务价值的用户分类。不论黑猫还是白猫,能抓老鼠的猫就是好猫,同理不论高级的方法还是简单的方法,只要能够解决问题的方法就是好方法。