目录

《数据资产管理》

当数据分析成为一种搜索……

构建智慧众筹的数据应用商店

《数据虚拟化》 

《企业IT架构转型之道 阿里巴巴中台战略思想与架构实战》

《增长黑客》

《大数据之路:大数据实践》

《大数据大创新:阿里巴巴云上数据中台之道》


《数据资产管理》

数据资产定义:企业及组织拥有或控制,能给企业及组织带来未来经济利益的数据资源。

拥有数据≠掌握资产

只有能创造未来经济利益的数据资源才是数据资产。

数据管理:由十大职能组成:

数据资产管理 开源架构 数据资产管理包括_数据资产管理 开源架构

数据资源管理:包含传统数据管理的基础上,覆盖范围更广,从适用对象来看,更偏重于OLAP系统。这里,数据主要作为生产资源,关注的目的是去选技术手段,以有效地控制数据资源,并提升数据资源的利用率。

数据资产管理:核心思路是把数据对象作为一种全新的资产形态,并以资产管理的标准和要求来加强相关体制和手段。

数据资产管理 开源架构 数据资产管理包括_虚拟化_02

第三章:治理管控:数据资产管理的基础所在

本章内容比较具有实用价值。

P52 数据治理涉及的IT技术主题众多,包括元数据管理、数据标准管理、数据质量管理、主数据管理、数据安全管理、数据集成管理等。

第四章:应用创新

当数据分析成为一种搜索……

传统数据分析过程可分为九个步骤:……(见P118),这种模式更多面向数据科学家、统计专家或数据高手。

核心人才稀缺,导致数据分析曲高和寡。

搜索式的数据分析能力,即通过搜索引擎,把数据分析的过程,变成寻求不同答案的过程,基于基于现有的数据认识,通过一系列的假设、关联、验证,最终找到一个相对可靠的答案。

这样的过程,可能并不精确,但其带来应用难度的下降,从而给数据分析带来多方面便利。从而创造“人人都是数据分析师”
的良好局面。

这种类似“搜索引擎”的方式,更亲近人类认知模式,即通过“提问-回答”不断获取更多信息,形成对某一事物或规律的看法,并不断修正或加固,最终形成一个相对来说确信无疑的观点。

以搜索方式来进行数据分析可以类似于这个过程:

例如:要寻找最适合营销的人群:

数据资产管理 开源架构 数据资产管理包括_数据分析_03

数据资产管理 开源架构 数据资产管理包括_数据_04

 

数据资产管理 开源架构 数据资产管理包括_虚拟化_05

构建智慧众筹的数据应用商店

借鉴App Store模式,通过引入更多的数据应用开发者,加强数据应用在企业内部或公开环境下的流动,有助于更好地满足快速发展、日益丰富的数据应用需求,并借此促进数据应用创新的百花齐放。

数据资产管理 开源架构 数据资产管理包括_虚拟化_06

数据资产管理 开源架构 数据资产管理包括_虚拟化_07

数据资产管理 开源架构 数据资产管理包括_数据分析_08

第五章:流通经营:数据资产管理的终极方向

但,难。

目录:

数据资产管理 开源架构 数据资产管理包括_虚拟化_09

数据资产管理 开源架构 数据资产管理包括_虚拟化_10

数据资产管理 开源架构 数据资产管理包括_数据_11

数据资产管理 开源架构 数据资产管理包括_虚拟化_12

《数据虚拟化》 

2019.10.11 1hour

星形模式:事实表在中间,维度表想涉嫌那样从中间发射出来。

事实表是星形模式的中心表。维度表与维度表之间没关系,终于事实表有关系。

雪花模式:类似星形模式。但雪花模式的维度表是标准化的,维度表可以和其他的表存在一对多的关系。

两种模式均不存在多对多的关系。

相比之下,雪花的优势在于减少冗余数据存储。此外,雪花模式还支持维度表中更低级别字段的查询。

部署数据虚拟化的优点:去耦合性、共享元数据规范、按需转换。

    详情展开见7.3

部署数据虚拟化的缺点:略。见7.4

数据虚拟化设计指南:见第八章

主数据:第10章

创建业务对象的360°试图是困难的。主数据帮助解决。

什么是主数据:

主数据是一个组织中核心业务对象的数据。主数据的管理是i健康的。

数据资产管理 开源架构 数据资产管理包括_数据资产管理 开源架构_13

数据资产管理 开源架构 数据资产管理包括_数据_14

数据资产管理 开源架构 数据资产管理包括_数据资产管理 开源架构_15

数据资产管理 开源架构 数据资产管理包括_数据资产管理 开源架构_16

数据虚拟化是一种转化异构数据库集合和文件的技术,这种技术使得这些数据看起来像一种集成的数据。在用于商务智能系统时,它可以使数据架构更简单、更便宜,最重要的是更敏捷。新的报告和分析需求可以更快实施,现有系统可以更容易改变。这就需要增加敏捷性:一方面,商务用户需要其系统提供更多的敏捷性,因为他们的世界已经开始改变;另一方面,商务智能的新形式,如运营报告、大数据分析在IT行业,我们已经进入了虚拟化时代。似乎这一行业中的任何东西都可以虚拟化,包括内存、外存、网络和数据中心。虚拟化技术很热门,比如云技术的普及也可以归类为虚拟化技术。虚拟化技术就是热点,并且在一段时间内都将是技术的焦点。
所有虚拟化技术和概念的共同点是它们封装了某个资源。任何虚拟化解决方案都隐藏了可用资源的数量、资源的位置以及获取资源所需的API等。但不要将虚拟化与一些电脑游戏所提供的虚拟世界混淆。这些游戏提供了一些虚拟的东西,但它们并没有封装特定的资源。
本书将解释一种特定形式的虚拟化:数据虚拟化。简而言之,数据虚拟化意味着将数据以集成的方式提供给应用程序,而不管所有数据是否分布在多个数据库中,是否以不同格式存储,是否可通过不同的数据库语言进行访问。数据虚拟化技术将这些不同的数据存储作为一个逻辑数据库呈现给应用程序。虽然数据虚拟化产品和技术已经存在了一段时间,但是大约在2009年,它才逐步得到了应有的关注。因为它对解决方案的影响—增加的敏捷性,所以越来越多的组织正在采用虚拟化技术,似乎可以认为21世纪的第二个十年将成为数据虚拟化的十年。
数据虚拟化可以部署在需要检索和操作数据的所有类型的信息系统中,例如经典数据输入系统、基于因特网的系统、面向服务的系统、主数据管理系统和商务智能系统。本书的重点是商务智能系统。数据虚拟化可用于整合来自各种数据源的数据,包括数据仓库、数据集市和生产型数据库。它有潜力改变我们开发商务智能系统的方式。数据虚拟化将成为大多数这类系统的心脏。
简而言之,数据虚拟化允许我们使用更简单和更灵活的架构构建商务智能系统。如果你想知道怎么做和为什么,本书就是为你而写的!本书将详细描述数据虚拟化产品的工作原理、技术应用、应该做什么和不做什么,以及在商务智能系统中应用它的好处。

《企业IT架构转型之道 阿里巴巴中台战略思想与架构实战》

2019.10.11 2hours

数据资产管理 开源架构 数据资产管理包括_数据_17

数据资产管理 开源架构 数据资产管理包括_数据资产管理 开源架构_18

数据资产管理 开源架构 数据资产管理包括_数据_19

主要内容:
  1)阿里巴巴分布式服务框架解析。
  2)业务中台如何支撑业务快速创新。
  3)服务在线化带来高效的服务共享。
  4)组织阵型优化带来团队效能的提升。
  5)传统企业互联网转型的成功案例。
  6)数据库分库分表的*佳实践。
  7)提升应用性能的典型设计方案。
  8)如何打造数字化运营平台。
  9)大规模业务平台稳定性能力的打造。
  10)海量日志实时处理的分布式体系构建。
  11)错综复杂的服务调用链路如何跟踪与分析。

《增长黑客》

airbnb初创时期的故事很精彩啊。

数据资产管理 开源架构 数据资产管理包括_数据分析_20

8.5 外卖库案例也有意思。

《大数据之路:大数据实践》

《大数据大创新:阿里巴巴云上数据中台之道》