大数据计算技术

  • 大数据计算体系层次
  • 1数据应用系统
  • 2数据计算处理系统
  • 3数据存储系统
  • 3.1功能
  • 3.1.1数据清洗、抽取和建模
  • 3.1.1.1建模
  • 3.1.1.1.1概念模型
  • 3.1.1.1.2逻辑模型
  • 3.1.1.1.3物理模型(存储)
  • 3.1.2数据存储架构
  • 3.1.3数据仓库和数据服务
  • 3.1.4统一数据接口
  • 3.2层次单元
  • 3.2.1分布式文件系统:提供物理存储架构
  • 3.2.2分布式数据库:not only sql database


大数据计算体系层次

所生成的处理架构msil 计算处理架构_架构

所生成的处理架构msil 计算处理架构_架构_02

1数据应用系统

所生成的处理架构msil 计算处理架构_云计算_03

2数据计算处理系统


所生成的处理架构msil 计算处理架构_所生成的处理架构msil_04


所生成的处理架构msil 计算处理架构_big data_05


计算模型(计算模式)的概念:
计算模型针对领域问题提出技术解决方案的基础模型、数据结构和算法
其中不同的计算模型的衡量标准:

所生成的处理架构msil 计算处理架构_数据_06

3数据存储系统

所生成的处理架构msil 计算处理架构_数据_07

3.1功能

3.1.1数据清洗、抽取和建模

所生成的处理架构msil 计算处理架构_所生成的处理架构msil_08

3.1.1.1建模

所生成的处理架构msil 计算处理架构_架构_09



所生成的处理架构msil 计算处理架构_所生成的处理架构msil_10

3.1.1.1.1概念模型

(定义基于业务的实体类)

3.1.1.1.2逻辑模型

(给出实体类的更多表的细节(主键、外键等)在纸上表达的对数据(关系等)的抽象,数据库提供了数据的逻辑存储结构)

3.1.1.1.3物理模型(存储)

( 把实体数据存储到磁盘或者内存中,分布式文件系统提供数据的物理存储结构)

3.1.2数据存储架构

所生成的处理架构msil 计算处理架构_所生成的处理架构msil_11


所生成的处理架构msil 计算处理架构_所生成的处理架构msil_12

3.1.3数据仓库和数据服务

3.1.4统一数据接口

所生成的处理架构msil 计算处理架构_数据_13


传统的数据库接口:ODBC、JDBC

问题:如果数据库既需要支持java编写的应用程序,也要支持c++写的程序,所以:


所生成的处理架构msil 计算处理架构_架构_14


目前的大数据采用的是:统一数据读写接口

3.2层次单元

3.2.1分布式文件系统:提供物理存储架构

(对数据的物理存储架构,如果没有,则无法长期、持久保存数据)

例如:HDFS、GFS都采用主从架构

主节点管理一组从节点

数据划分为小的数据块,又生成备份,都会存储到文件系统中

所生成的处理架构msil 计算处理架构_所生成的处理架构msil_15

3.2.2分布式数据库:not only sql database

所生成的处理架构msil 计算处理架构_big data_16