一.数据管理技术的发展
1.分为四个阶段:人工管理阶段、文件系统阶段、数据库阶段和高级数据库阶段。
2.数据库阶段数据管理的特点:
1)采用数据模型表示复杂的数据结构。
2)有较高的数据独立性。
3)数据库系统为用户提供了方便的用户接口。
4)提供四方面的数据控制功能:数据库的恢复、数据库的并发控制、数据的完整性、数据安全性。
5)增加了系统的灵活性
3.数据库(DB):是长期存储在计算机内、有组织的、统一管理的相关数据的集合。
4.数据库管理系统(DBMS):是位于用户与操作系统直接的一层数据管理软件它为
用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。
5.数据库系统(DBS):是实现有组织地、动态地存储大量关联数据、方便多用户访问的计算机硬件、
软件和数据资源组成的系统,即它是采用数据库技术的计算机系统。
二、数据描述
1.分为三个阶段:概念设计、逻辑设计和物理设计。
2.概念设计中的术语:
1)实体:客观存在,可以相互区别的事物称为实体。
2)实体集:性质相同的同类实体的集合。
3)属性:实体有很多特性,每一个特性称为属性。
4)实体标识符(关键码或键):能唯一标识实体的属性或属性集。
3.逻辑设计中的术语:
1)字段(数据项):标记实体属性的命名单位称为字段或数据项。
2)记录:字段的有序集合。
3)文件:同一类记录的集合。
4)关键码:能唯一标识文件中每个记录的字段或字段集。
4.实体之间联系的元数:与一个联系有关的实体集个数。常用二元联系。二元联系的
类型有三种:一对一、一对多、多对多。
三.数据抽象的级别
1.数据模型:描述数据库的结构和定义,对现实时间的数据进行抽象。
2.从现实世界的信息到数据库存储的数据以及用户使用的数据是一个逐步抽象过程,
根据数据抽象的级别定义了四种模型:概念模型、逻辑模型、外部模型和内部模型。
3.概念模型:表达用户需求观点的数据全局逻辑结构的模型。
4.逻辑模型:表达计算机实现观点的DB全局逻辑结构的模型。
5.外部模型:表达用户使用观点的DB局部逻辑结构的模型。
6.内部模型:表达DB物理结构的模型。
7.数据抽象的过程、即数据库设计的过程具体步骤:
1)根据用户需求,设计数据库的概念模型;
2)根据转换规则,把概念模型转换成数据库的逻辑模型;
3)根据用户的业务特点,设计不同的外部模型,给程序员使用;
4)数据库实现时,要根据逻辑模型设计其内部模型。
8.常用的概念模型是实体联系(ER)模型,ER模型主要用ER图来表示。
9.逻辑模型的分类:层次模型、网状模型、关系模型等。
10.层次模型:用树型(层次)结构表示实体及实体间联系的数据模型。
11.1969年,美国IBM公司的IMS系统是典型的层次模型系统。
12.网状模型:用有向图结构表示实体及实体间联系的数据模型。
13.1969年,CODASYL组织提出DBTG报告中的数据模型是网状模型的主要代表
14.关系模型:是由若干个关系模式组成的集合。关系模式即记录类型,它的实例
称为关系,每个关系实际上是一张二维表格。
15.1970年,美国IBM公司的EFCodd连续发表论文,提出关系模型,奠定了关系数据库的
理论基础。关系数据库是目前的主流数据库。
16.外部模型中的模式称为视图。
17.三级模式:
从用户(或应用程序)到数据库之间,DB的数据结构描述有三个层次:
1)外模式:用户与数据库系统的接口,是用户用到的那部分数据的描述。
外模式由若干个记录类型组成。
2)逻辑模式:是数据库中全部数据的整体逻辑结构的描述。
3)内模式:是数据库在物理存储方面的描述。
注意:外模式是逻辑模式的子集。
18.两级映像:
1)外模式/逻辑模式映像:存在于外模式和逻辑模式之间,用于定义外模式和逻辑
模式之间的对应性。
2)逻辑模式/内模式映像:存在于逻辑模式和内模式之间,用于定义逻辑模式和内
模式之间的对应性。
19.数据库系统的三级模式、两级映像结构使数据库系统达到了高度的数据独立性。
20.数据独立性:是指应用程序与数据库的数据结构之间相互独立,在修改数据结构时,
尽可能不修改应用程序。分为逻辑数据独立性和物理数据独立性。
21.逻辑数据独立性:如果数据库的逻辑模式要修改,那么只要对外模式/逻辑模式
映像作对应的修改,可以使外模式和应用程序尽可能保持不变。这样就认为数据库达到了
逻辑数据独立性。
22.物理数据独立性:如果数据库的内模式要修改,即数据库的物理结构有所变化,那么
只要对逻辑模式/内模式映像作相应的修改,可以使逻辑模式尽可能保持不变。
也就是对内模式的修改尽量不影响逻辑模式,当然对外模式和应用程序的影响更小,这样就认为
数据库达到了物理数据独立性。
第三章 关系模式设计理论
一、关系模式的设计准则
1、数据冗余:同一个数据在系统中多次重复出现。
2、关系模式设计不当引起的异常问题:数据冗余、操作异常(包括修改、插入和删除异常)
3、关系模式的非形式设计准则
1)关系模式的设计应尽可能只包含有直接联想的属性,不要包含有间接联系的属性。
也就是,每个关系模式应只对应于一个实体类型或一个联系类型。
2)关系模式的设计应尽可能使得相应关系中不出现插入、删除和修改等操作异常现象。
3)关系模式的设计应尽可能使得相应关系中避免放置经常为空值的属性。
4)关系模式的设计应尽可能使得关系的等值连接在主键和外键的属性上进行,并且保证以后
不会生成额外的元组。
4、习惯使用的一些符号:
1)英文字母表首部的大写字母“A,B,C...“表示单个的属性。
2)英文字母表尾部的大写字母“...,U,V,W,X,Y,Z“表示属性集。
3)大写字母R表示关系模式,小写字母r表示其关系。
4)关系模式的简化表示方法:R(A,B,C...)或R(ABC...)
5)属性集X和Y的并集简写为XY。
二、函数依赖
1、函数依赖(FD)的定义:设有关系模式R(U),X和Y 是属性集U的子集,
函数依赖是形成X-->Y的一个命题,只要r是R的当前关系,对r中任意两个元组
t和s,都有t[X]=s[X]蕴涵t[Y]=s[Y],那么称FD X-->Y在关系模式R(U)中成立。
说明:1)