【导语】
图数据库作为新型数据库,能处理海量、复杂关联、结构多变的数据,效率比传统关系型数据库有千万倍提升,尤其适用物流优化、实时推荐、金融征信等领域。领英、沃尔玛、惠普、亿贝等全球知名企业都在借助图数据库的优势,优化企业服务,提升客户体验。阿里、腾讯、百度、华为等国内巨头也已开始拥抱图数据库技术的业务赋能。随着5G、物联网时代的到来,人们获取信息的规模、方式和速度都以前所未有的速度增长,数据间联系的复杂度节节攀升,而图数据库为我们处理这些海量关联数据提供了全新可能。
本文将带您理解如何用图数据库实现实时个性化推荐,帮助您的客户随时随地发现感兴趣的信息或商品,从而提升客户体验、有效促进信息访问和商品销售,增加客户停留时间、提高客户粘性。
传统推荐系统
“啤酒与尿布”的故事我们都听过,年轻爸爸去超市购买尿布的时候也会顺手买点啤酒,沃尔玛超市管理人员发现这种现象后将两种商品进行捆绑销售,获得了更好的销售利润。这一故事背后的理论依据便是“推荐算法”。因为啤酒和尿布经常出现在同一购物车里,所以向购买尿布的年轻爸爸推荐啤酒也在情理之中。如今互联网迅猛发展,信息过载严重,准确找到客户兴趣点、捕捉客户注意力变得更加困难。因此,如何从众多数据中准确并快速找到有效信息,增加客户粘性,提升客户体验,便是推荐系统的价值所在。好的推荐系统可以帮助商家实现流量变现,从交叉销售和追加销售中获得盈利,推荐的个性化程度越高,企业的回报率也随之增高。亚马逊的个性化产品推荐号称推荐之王:其整体营业收入中近35%来自交叉销售和追加销售。
推荐系统本质是客户和商品之间的桥梁,基本任务是帮助客户解决信息过载的问题,从海量商品中准确并快速找到客户最喜爱、最有可能购买的产品。在互联网领域,线上推荐系统常见的应用场景大致可分两类:一个是基于用户维度的推荐,即根据用户的历史行为和兴趣偏好进行推荐,比如网易云首页的推荐歌单、小红书首页的发现等;另一个是产品维度的推荐,也就是根据用户当前浏览的商品进行推荐,比如淘宝特定商品的“找相似”功能。不管是基于用户维度的推荐还是基于产品维度的推荐,推荐过程本质是信息过滤的过程:推荐系统通过分析用户的历史购买和当前行为模式,在用户退出页面前过滤掉不太可能引起用户兴趣的产品,再根据优先等级返回最相关Top-N产品列表。大致流程如图1。

图1 推荐流程

图2 架构上的挑战
客户对产品的行为数据是推荐系统中最核心的数据,这些数据直接表明了客户可能感兴趣的产品。而现有的推荐系统架构将客户和产品的特征信息分离,再根据具体的模型生成不同的客户/产品特征信息(如图2)。要查找某客户可能感兴趣的产品时,系统基于客户行为分析的推荐算法,建立关于客户和产品的相似度矩阵,从中选出客户可能感兴趣的产品集。但随着客户数量和产品数量的持续扩大,计算客户/产品的相似度矩阵代价很大,无法保证推荐的时效性:系统在客户行为发生改变时难以做到推荐内容上的即时更新。
“准而快”是推荐效果中的制胜关键。随着线下新零售和场景营销时代的到来,推荐系统需要考虑的维度日益增多:时间、地点、天气、突发事件等都会成为影响客户购物体验的重要因素。不论线上还是线下,购物者注意力持续时间越来越短,若不能按客户当下行为进行多维度实时推荐而错过适宜时机,潜在客户极有可能流失。对零售商来说,如今产品目录变更周期短,变更速度快;潜在客户服务要求高,等待耐心低;场景营销背景下推荐维度复杂,事物关联程度高。推荐引擎需要快速理解客户画像,多维度考虑关联数据,将场景化流动性的客户兴趣与不断迭代的产品信息实时关联起来形成定制化推荐成为巨大挑战。
图技术赋能实时个性化推荐
从数据存储到召回,再到更深一步的排序环节,系统筛选出来的商品集越集中,精度越高,推荐效果越好,但难度也随之增大。提高召回速度,帮助系统从海量商品中实时找出和客户当下兴趣以及消费场景相关的产品,便是图数据库的优势所在。

图3 基于购买和好友关系的推荐实例
如图3,图数据库可根据客户、客户对产品的购买行为、客户之间的关系、产品间的内在相关性等多种维度对客户进行推荐。对某给定客户,我们即可分析所有客户的购买行为,从而找到与之购买行为相似的其他客户,为其生成“购买该产品的客户也喜欢……”的推荐列表;又可以通过客户之间的好友关系,为目标客户生成“您的好友也喜欢…“的推荐列表。更重要的是,图数据库可以同时结合多种维度进行推荐,比如“与您购买过同类产品的好友同时也喜欢…”。
这些相似客户和好友喜欢的产品,也是当前客户最有可能感兴趣的产品。通过图数据库的多跳关联查询,我们可以实时提取所需的数据,完成快速召回。接下来就是对召回的产品按与当前客户的相关度高低进行排序。通过基于图的推荐算法,综合比较客户与产品之间关系的远近(路径长度)、疏密(路径数)、和偏好程度(路径上边的权重),可以准确地得出产品与客户的相关度。同时,通过对特定类型边进行适当的加权,可以凸显不同推荐场景下特定关系的影响力差异,例如可以对好友关系边进行加权,来反映社交营销场景下社交关系的强影响效果。
不同于关系型数据库,图数据库的schema灵活性强,可根据场景和业务需求添加不同种类的新关系、新节点、新标签形成新的子图,从而动态调整新的推荐策略,而不用担心破坏已有的查询或应用程序的功能。如图4,我们可在图3基础上添加客户的地理位置信息,进而根据客户移动位置实时推荐合适的门店,优化客户平台使用体验。通过实时收集并分析客户、购买行为、产品、好友关系、位置、营销事件等信息,全面刻画客户消费场景,针对客户的行为偏好、社交群落及消费场景,以数据、社交模型和AI算法为驱动,配合反馈迭代式算法策略,深度认知客户需求,实现“人-货-场”的联动,进行“千人千面”的具有可解释性的实时推荐,帮助企业快速、有效地发现海量数据中隐含的价值信息,赋能业务增长。图数据库的模型灵活性免去了项目之初穷思竭虑将每一个细节囊括在内的烦恼,让用户根据公司业务发展和客户所在场景变化灵活改变数据模型,实现客户、产品和场景三者的高效动态关联,极大降低系统迭代的成本和开发周期。

图4 基于客户移动地点的实时推荐
Galaxybase图数据库
Galaxybase作为一款原生分布式并行图数据库,相比关系型数据库具备强大的业务灵活性,可根据业务需求灵活修改数据结构和模式(schema);与同类产品相比,Galaxybase支持高效点边读写,万亿节点实时查询,能够实现大数据条件下的亚秒查询返回,足以满足真实场景下的实时个性化推荐需求。
【结语】
综上所述,推荐引擎的即时性、精准性、和相关性是大数据时代实时个性化推荐的成功秘诀。在以内容为支撑的场景消费大势下,品牌对客户心智的影响正在被削弱,即时兴趣对购买决策正发挥越来越大的影响。所以,实效性和精准度对推荐系统提出了巨大的挑战。传统方法面对越来越多的产品、客户和日益复杂的消费场景,无法保证推荐内容的实时更新,容易错失达成交易的最佳时机,造成潜在客户流失;Galaxybase图数据库灵活的schema可根据业务需求的不断变化,通过增加新节点/新关系,淘汰旧节点/过时关系,不断调整客户、产品和场景之间的关联图谱,从而实现灵活高响应推荐策略。Galaxybase强大的关联处理能力可实现实时计算,多维度还原业务场景,快速返回客户潜在兴趣商品,精准洞察客户需求、实现实时场景推荐,赋能客户,最大程度把握交易达成时机。
-END-
















