Teradata (以下简称TD) 总览
本课的学习目标
- 描述Teradata数据库产品的功能
- 知晓支持的操作系统
- 描述Teradata的并行架构
- 解释线性可扩展性
- 列出Teradata DBA永远不需要做的操作
- 描述Teradata数据库的优势
什么是Teradata数据库?
TD数据库是一种管理公司数据仓库的关系型数据库管理系统(RDBMS),并且是一个开放的系统,遵循工业ANSI标准。目前在MS Win2000/2003 Server上也可用。 MP_RAS UNIX已经不再支持,转而支持SuSE Linux。
所以支持的操作系统为:
- MS windows 企业级 Server
- SuSE Linux 10/11
- 任何开放架构的OS
Teradata并行架构
- 支持最多的数据仓库
- 支持10GB到50PB之间的数据库
- 提供一个并行感知优化器,使得不需要运行复杂的优化去获得一个高效率的查询
- 自动的数据分发终结了复杂的索引结构以及耗时的重组
- 自始至终基于一个并行的构架上
- 支持标准的ANSI SQL,使得Teradata数据库可以接受任何第三方BI工具或者数据库平台的调用
- 整个MPP系统有着单一的操作界面并且DBA可以使用Teradata ViewPoint进行单点控制
Teradata数据库可用于决策支持
可扩展性
并行使得有能力操作上T的数据在众多单独的处理器上并发运行更小的任务从而操作大量的数据
TD数据库可应对很多方面的增长,包括:
- 处理众多并发用户的能力
- 通过增加节点(nodes)来增加处理器的运算能力,而无需更换应用程序,工具以及数据模型
- 增加更多磁盘空间或者处理器的能力,而不会产生卸载/重载数据或者手动给数据分区的需求。
- 线性的可扩展性提供了一种动态变化支持更多用户/数据/查询/复杂度的能力,而不会出现性能下降
所以并行架构的特点如下:
- 线性的可扩展性
- 哈希算法提供了自动数据分发能力
- 标准ANSI SQL,允许使用BI工具和其他数据库接口,以及不定期的查询
- 并行感知优化器
- 单一管理界面
Teradata数据库的优势
简单的列表如下:
- 被证明的线性的可扩展性 - 增加负载却不会带来负面效果
- 最多的并发用户 - 并发的复杂查询
- 无条件的并行能力 - 排序,聚合和全表查询皆可并发运行
- 成熟的优化器 - 灵活的并行感知,处理不定时的复杂查询,每个查询可支持多个join
- 文件系统 - 自动管理磁盘数据,无需重建索引
- 低管理成本(TCO) - 安装维护很简单,灵活的并行工具,无需重组数据,数据的自动分发,低磁盘数据比,灵活的可扩展工具
- 高可用性 - 零错误容忍架构
- 单一的业务视图 - 一个数据库多个客户端
Teradata数据库的可管理性
这个体现在TD DBA有一个从不需要做的事项列表
- 重组数据或索引空间
- 提前给数据表/索引分配空间和格式化分区。实际上当需要分区索引的时候也不是必须的,并且不需要手动维护。
- 提前准备读取数据(转换,排序,分割,等等)
- 确保查询并行处理
- 扩展引起的卸载/重载数据空间
TD的数据库中,设计一个100行的表和100万行的表是一样的操作。TD DBA知道当数据成倍增长的时候系统可以自适应。
Teradata数据库的功能
- 被设计用于处理大量详细数据
- 理论上是为了数据仓库应用
- 并行使得轻易访问大数据表成为可能
- 开放的构架 - 使用了工业标准组件
- 运行在工业标准系统上
- 运行效率和增加的组件成正比
- 对于客户端运行为一个数据库服务器
- 运行在多种硬件混合平台上(SMP)以及Teradata的硬件(MPP)
说了这么多,大家都记住了吗?这就是巴巴爸爸、巴巴妈妈、巴巴祖、巴巴拉拉、巴巴利波、巴巴伯、巴巴贝尔、巴巴布莱特、巴巴布拉伯!
写笔记好累啊。。。努力不让这个系列变成坑。