早在15年,Forbes就已经提出:当企业开始正视已有数据资产的时候,往往也是他们开始采纳主数据管理的时候。而从各大趋势和分析报告看来,那些着手主数据管理的企业,似乎都投身于同一种新型技术——图数据库。

1.什么是主数据(MD,Master Data)?

主数据是企业的核心数据资产,也是整个企业范围内各个系统间要共享的数据,一般用于描述企业中关键的人、物、地等实体,可以是与客户、供应商、账户及组织单位相关的数据,如客户画像、门店地址、产品品类、原材料供应商等等,是企业内具有相对静态特征的、最新的、最准确的信息。

2.什么是主数据管理(MDM,Master Data Management)?

主数据库管理,顾名思义就是管理主数据的一组规程、技术和解决方案,主要用以解决企业数据质量和一致性问题。MDM创建了一个数据的“黄金记录”,从许多数据入口点收集数据,确保企业共享主数据资产的唯一性、准确性、语义一致性和可靠性。想象一下,随着企业规模的增大,企业内各类系统不断增多,要维护和共享的数据也随之增加。假设某个客户的电话信息出现变动,理想状态下我们希望这个客户的电话信息在企业所有的系统中都同步更新,保持一致,这也是主数据管理的核心功能和目的:保持企业重要数据的一致性、唯一性、准确性和可靠性,提升企业的数据质量。

3.图数据库能成为MDM的金刚钻吗?

按照上文的说法,如果现有MDM能够保证企业核心数据的一致性、唯一性和准确性,防止企业因为数据错误产生不必要的损失,我们似乎没有什么理由多此一举,仅仅因为图数据库的火热趋势而盲目采纳,徒增成本。

实际上,市场上绝大部分的MDM还是把关系型数据库的二维表结构作为主数据存储的主要方式。这也意味着,MDM存在严重的外键依赖。对于一条客户记录,我们可以把客户的手机号作为外键,通过该外键找到该客户在企业中的主记录,或者通过这个外键找到业务系统中该客户的其他信息。当“关系”数量不多,“关系”不频繁的时候,关系型数据库完全能够应对这类查询。可一旦“关系”层次增多,“关系”日益频繁,关系型数据库昂贵耗时的表连接操作会带来严重的成本问题和复杂性问题。这个时候,如果有图数据库作为补充,直接将那些稳定不变的“关系”存储为“主数据”,关系型数据库的外键依赖问题就能得到很好的解决。从这个角度看,图数据库和关系型数据库在数据管理上可以形成良好的协同效应:关系型数据库致力于管理数据,图数据库则着重管理数据间的关系。

而“关系”,也能成为“主数据”。

举个例子,“A和B是高中同学,两人又同在一家公司上班”,这是相对稳定的关系,轻易不会改变,这类稳定的关系已经足够被存储为主数据了。再比如,当A在网购平台买了某类产品后,一开始我们会认为这是再平常不过的一次交易行为,但如果在很长一段时间内A又多次复购了该类产品,呈现出比较固定的购买“模式”,这时候这类购买行为数据看起来又似乎可以作为主数据了。可见,“关系”本身也能成为主数据。而随着业务的变化,主数据的动态性问题随之出现,主数据扩充、调整也变得频繁起来。

和关系型数据库不同的是,图数据库把实体间的“关系”也视为一等公民,不用通过外键进行表连接操作,而是直接存储了“关系”。这样一来,我们不仅可以通过字段搜索客户信息,还可以通过数据间的“关系”去搜索信息。当知道与某个客户有关的任何一条信息后,图数据库就能快速告诉我们,和该客户相关的所有其他信息,而不需要通过复杂的多表连接操作。

图数据库降低MDM的时间和人力成本。

再举个简单的例子,如果你是公司华东地区的销售负责人,想知道公司新品在杭州市不同年龄段客户群的热销程度,继而拟定下一步的销售策略,图数据库顺着“购买”这类关系边就能迅速找到该产品的购买群体,继而筛选出其中杭州市同一年龄段的购买者。我们能用关系型数据库+数据仓解决这类问题吗?可以。但时间成本和计算复杂度是不能不谈的问题。用关系型数据库解决这类问题需要撰写复杂的查询语句和漫长的等待时间,需要耗费大量的人力成本,而这些时间成本,会耽误决策、会影响业务,更是不可估量的金钱损失。

反言之,如果我们把MDM中的数据备份到图数据库中,就能进一步挖掘、分析数据间的“关系”和数据本身。有了图数据库作为MDM的补充,我们就能串联起关于客户的全貌而非聚焦客户的单一视角。可以说,图数据库扩展了MDM的能力边界,让实时构建客户全貌成为可能。