第一建模:
1)获取原始数据(用户访问的行为日志,用户基本属性),得到用户行为信息
2)数据预处理,挖掘出事实标签。对用户数据进行过滤,清洗,简化。例如:得到用户第一次登陆时间,名称等事实标签
3)分析用户的行为,构建用户画像的核心标签。通过用户行为分析,得到用户访问页面的规路,构建用户行为模型
4)通过模型进行预测,完善用户画像,预测用户的操作行为
模型:
1)文本挖掘模型:(TF-IDF);处理清洗数据,匹配标识用户数据;提取事实数据
2)分类/聚类(KNN,贝叶斯):预测新用户,分析有相同特征的群体信息,对用户进行划分
3)机器学习:挖掘出标签(特征提取)
4)相似度模型(EM,回归,决策):(余弦,皮尔森相似度)辅助分类,聚类
5)辅助算法:Aprior:根据用户访问情况推测出兴趣标签,完善用户画像
6)预测算法:回归 用户兴趣程度,流失预测,实现个性化推荐
第二:多维度用户画像
1)自然属性:例如:姓名,年龄
2)兴趣属性:行为偏好,随着时间变化而变化,对应的标签也是变化(TF-IDF模型)
3)地理位置信息(LBS):用户的移动轨迹,配置不同的服务
4)IP:不同IP查出不同区域,不同数据
5)隐含属性:打开频率,体现出用户的活跃的情况,系统是否有属性
第三:标签(MECE法则:相互独立,完全穷尽)
1)用户需求和用户场景不断更新,所以标签体系在不断的完善
2)不同的用户需求和业务场景思考,用户标签系统不同,业务标准体系不同
3)标签体系结构框(一级标签,二级标签,三级标签...N级)
第四: 映射用户画像
数据------映射成标签
a.分析原始数据
b.处理 挖掘统计
C.生成映射 标签表
d.跟用户交互
第五:评估用户画像
评估用户画像
1)用户覆盖率
2)准确性
3)及时性
4)可解释性
5)可扩展性
画像应用拓展:业务分析,精准营销,推广告,站内信,千人千面
画像产品架构