“Any intelligent fool can make things bigger, more complex,and more violent. It takes a touch of genius— and a lot of courage— to move inthe opposite direction  -- 爱因斯坦

 

接手数据平台重构项目我认为首要做的就是梳理归纳,通过“分的”方式把无序凌乱的数据源、过程、口径指标复杂数据链路分解成不同的数据脉络,将不同的脉络数据进行分离设计,根据当前的业务重点与策略考虑推演架构的演进过程。

当细节梳理完毕后就是合的一个过程,是抽象的过程,把共性的东西进行抽象并通过拼接组合来行程一个图并表达出来。

在这里进行由粗向细粒度分析时有两种方式,一个是自顶向下的分解,一个是自底向上演绎和归纳。

自顶向下分解非常考验人对数据平台细节知识的熟知程度,如果对数据平台&数据仓库细节了解不足或不彻底,很难产出一个合理的结构来,而且在实际建设中不知道哪里就触发了连环雷。

在数据平台项目中归纳推演就是利器、问题的重要识别就重要的开始、主干细节就会真正成败的关键、合适的减法让工作更有效。

在归纳之前的问题识别中肯定要问问题起点在哪里,在与不同领域专家交流时经常被问题:

1. 你要解决的问题是什么?2.这里的问题定义是什么?

其实潜在的理解就是这个矛盾是什么,那些要早点解决,不早点解决会被激化,带来严重的后果的。问题被识别与准确定义是成功的开始。

比如在一个数据平台,经过调研工作掌握很多细节,那规整出问题。(这些问题是做了一定合并的),大家可以一起来考虑先如何识别问题的优先级、重要性、分类、不是问题的问题、弱相关的问题。

我的数据是怎样练成的 三_数据仓库

ps 到第三篇才发现刚把序章刚写完。囧(这次范围已定在平台重构-数据化运营建立-数据化运营平台推进)