②序列模式分析(Sequential Patterns):目的也是为了挖掘出数据之间的联系,但它的侧重点在于分析数据间的前后关系(因果关系)。例如,将序列模式分析运用于商业,经过分析,商家可以根据分析结果发现客户潜在的购物模式,发现顾客在购买一种商品的同时经常购买另一种商品的可能性。在进行序列模式分析时也应计算置信度和支持度。③分类分析(Classifiers):首先为每一个记录赋予一个标记(一组
(十八)、函数依赖集两个函数依赖集等价是指它们蕴涵的属性间的依赖信息等价,一个函数依赖集所蕴涵的全部函数依赖为其闭包,如果两个函数依赖集的闭包相等,即它们蕴涵的全部函数依赖相同,即为等价。(二十)、数据挖掘数据挖掘就是应用一系列技术从大型数据库或数据仓库中提取人们感兴趣的信息和知识,这些知识或信息是隐含的,事先未知而潜在有用的,提取的知识表示为概念、规则、规律、模式等形式。也可以说,数据挖掘是一类
丢失修改:是指两个事务T1和T2读入同一数据并修改,T2提交的结果破坏了T1提交的结果,导致T1的修改被丢失。并发控制不当。脏读:指当一个事务正在访问数据,并且对数据进行了修改,而这种修改还没有提交到数据库中,这时,另外一个事务也访问这个数据,然后使用了这个数据。因为这个数据是还没有提交的数据,那么另外一个事务读到的这个数据是脏数据,依据脏数据所做的操作可能是不正确的。不可重复读:指在一个事务内,
排它锁又称为写锁,用于对数据进行写操作时进行锁定。如果事务T对数据A加上X锁后,就只允许事务T读取和修改数据A,其他事务对数据 A不能再加任何锁,从而也不能读取和修改数据 A,直到事务T释放A上的锁。共享锁又称为读锁,用于对数据进行读操作时进行锁定。如果事务T对数据A加上了S锁后,事务T就只能读数据A但不可以修改,其他事务可以再对数据A加S锁来读取,只要数据A上有S锁,任何事务都只能再对其加S锁读
事务是一个操作序列,这些操作“要么都做,要么都不做”,是数据库环境中不可分割的逻辑工作单位。是数据库中恢复和并发控制的基本单位。事务显示结束的语句为:COMMIT(正常执行完毕,提交)、ROLLBACK(出现事务内部逻辑错误,回滚)。数据库故障会造成数据的不一致。数据库的更新是由事务驱动的,事务的ACID属性被破坏是数据不一致的根本原因。系统重启会使内存中更新过的数据未写入硬盘而丢失,破坏了事务的
(十七)、事务/隔离级别事务具有原子性、一致性、隔离性和持久性。这4个特性也称事务的ACID性质。①原子性(atomicity)。事务是原子的,要么都做,要么都不做。②一致性(consistency)。事务执行的结果必须保证数据库从一个一致性状态变到另一个一致性状态。因此当数据库只包含成功事务提交的结果时,称数据库处于一致性状态。③隔离性(isolation)。事务相互隔离。当多个事务并发执行时,
(十六)、关系模式根据主属性的定义“包含在任何一个候选码中的属性叫做主属性(Primeattribute),否则叫做非主属性(Nonprimeattribute)”,所以,关系R中的4个属性都是主属性。在关系数据库系统中,全码(All-key)指关系模型的所有属性组是这个关系模式的候选键,本题所有属性组为HLMP。关系模式的分解,必须保证分解具有无损连接性,即分解能够被还原,否则会发生信息丢失(通
数据控制功能包括对数据库中数据的安全性完整性、并发和恢复的控制。安全性是指保护数据库以防止不合法的使用所造成的数据泄露、更改或破坏。完整性是指数据库的正确性和相容性,是防止合法用户使用数据库时向数据库加入不符合语义的数据。保证数据库中数据是正确的,避免非法的更新。并发控制是指在多用户共享的系统中,许多用户能同时对同一数据进行操作时,保证数据库的完整性不受破坏,避免用户得到不正确的数据。故障恢复主要
联机分析处理(OLAP)可以被刻画为具有下面特征的联机事务:①可以存取大量的数据,比如几年的销铒数据,分析各个商业元素类型之间的关系,如销售、产品、地区、渠道。②需要包含聚集的数据,例如销售量、预算金额以及消费金额。③按层次对比不同时间周期的聚集数据,如月、季度或者年。④以不同的方式来表现数据,如以地区、或者每一地区内按不同销售渠道、不同产品来表现。⑤需要包含数据元素之间的复杂计算,如在某一地区的
OLAP服务器即联机分析处理服务器,是共享多维信息的、针对特定问题的联机数据访问和分析的快速软件技术。它通过对信息的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察它是数据仓库三层系统结构中的中间层。查询和报表工具、数据挖掘工具都属于前端工具。而数据仓库服务器存储的是数据,是数据仓库的数据层。数据仓库是面向分析的,支持联机分析处理(OLAP),数据库面向日常事
(十三)、结构化开发方法结构化设计方法是一种面向数据流的设计方法,与结构化分析方法衔接。在需求分析阶段,结构化分析方法产生了数据流图,而在设计阶段,结构化设计方法将数据流映射为软件系统的模块结构。数据流图中从系统的输入数据流到系统的输出数据流的一连串变换形成了一条信息流。其中的信息流一般情况下包括变换流型和事物流型。不同类型的数据流到程序模块的映射方法不同。一个软件系统往往不仅仅有一种数据流类型。
(十四)、数据 / 数据仓库ETL,Extraction-Transformation-Loading的缩写,中文名称为数据提取、转换和加载。ETL负责将分散的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。OLTP一般用于事务型数据库,OLTP 数据库旨在使事务应用程序仅写入所需的数据,以便尽
分布式数据库的全局概念层应具有三种模式描述信息:全局概念模式描述分布式数据库全局数据的逻辑结构,是分布式数据库的全局概念视图。分片模式描述全局数据逻辑划分的视图,是全局数据的逻辑结构根据某种条件的划分,每一个逻辑划分就是一个片段或分片。分配模式描述W部逻辑的局部物理结构,是划分后的片段或分片的物理分配视图。分布式数据库的透明性包括了分片透明、分配透明(复制透明、位置透明)、映像透明(模型透明);而
分布式数据库系统中的两阶段提交协议(2PC),其内容为:协调器向所有参与者发送 Prepare消息;各参与者若愿意提交属于自己的部分,则向协调器发ready消息,否则发abort消息;协调器收到所有参与者的ready消息后,方能再向所有参与者发commit消息,否则若超时或有一个参与者发来了abort消息,则协调器只能向所有参与者发rollback消息,撤销本事务。2PC保证了分布式数据库中的事务
聚簇索引要求物理记录次序与索引项次序一致,起到对物理记录的排序和重组织作用,可以提高某些查询的性能。数据库通过一组规则来保证数据输入的正确性,即完整性约束。完整性约束分为:实体完整性、参照完整性、用户定义完整性。①实体完整性:规定基本关系R的主键primary key:不能为空、也不能重复。②用户自定义完整性:就是针对某一具体关系数据库的约束条件,反映某一具体应用所涉及的数据必须满足的语义要求,由
(九)、E-R图在设计E-R图的过程中,首先应该确定相关的实体,即将所有对象进行分类:然后根据各类确定的实体,找出每一实体应具有的属性,这一过程称为聚集;再从相关实体中抽象出子类和父类,这一过程称为概括。面向不同的应用,设计E-R图,在构建实体时只需要考虑应用中所需要的属性。因此,面向不同应用的E-R图,其实体名称及属性可能会不同。同一现实中的对象,在不同E-R图中属性不同,称为结构冲突,合并时取
结构化分析模型包括数据流图、实体联系图、状态迁移图和数据字典,因此这些模型是需求分析阶段的输出。而确定软件体系结构是在软件设计阶段进行的。需求分析阶段完成对企业需求的调查整理,整理的结果以数据流图和数据字典的方式描述。其中数据流图描述业务处理流程和处理中使用的数据;数据字典用于详细描述各项数据,包括数据项、数据结构、输入输出流、加工处理等数据信息。E-R图用于概念设计,类图用于逻辑设计,用例图描述
(八)、数据库设计阶段在数据库设计过程中,外模式设计是在数据库各关系模式确定之后,根据应用需求来确定各个应用所用到的数据视图即外模式的,故设计用户外模式属于逻辑结构设计。数据的独立性是由DBMS的二级映像功能来保证的。数据的独立性包括数据的物理独立性和数据的逻辑独立性。数据的物理独立性是指当数据库的内模式发生改变时,数据的逻辑结构不变。为了保证应用程序能够正确执行,需要通过修改概念模式/内模式之间
SQL(Structured Query Language)结构化查询语言,是关系数据库的标准语言是数据库使用的重要接口。SQL语言的基本特点如下(1)综合统一。集数据定义语言(DDL),数据操纵语言(DML),数据控制语言(DCL)功能于一体。(2)高度非过程化,只要提出“做什么”,无须了解存取路径,即能完成操作。(3)面向集合的操作方式:操作对象、查找结果是元组的集合(4)以同一种语法结构提供
嵌入式SQL用于高级语言(主语言)和数据库的交互。高级语言用于客户端,实现界面及与用户的交互。SQL语言用于后台数据库,主语言将变量值传给SQL,或SQL将值传给主语言,是通过主变量来实现的,主语言需要对SQL语句的执行状态(是否执行成功、查询结果的记录数等)进行检查以确定下一步的处理,需要DBMS将SQL语句执行状态写入SQL主语言从中读取;游标通信区(即SQLCA),可以将SQL查询到的多条记
标准SQL中的权限收回语法为: REVOKE<权限>[,<权限>…] ON [<对象类型>]<对象名> FROM <用户>[,<用户>...];其中属性列的修改权限用UPDATE(<列名>)来表达;其中属性列的执行权限用EXECUTE;PUBLIC表示所有用户。事物的结束语句是ROLLBACK和COMMIT。当事务
(六)、SQL语句标准SQL中收回权限的基本语法是:REVOKE<权限>FROM<对象数据><对象名>FROM<用户>[RESTRICT|CASCADE];,其中CASCADE表示级联收回,即收回用户权限并同时收回该用户授予其他用户的该权限。GRANT是标准SQL提供的授权语句,即通过把数据库对象的操作权限授予用户,用户具有对象上的操作权限才能进行相
(四)、镜像技术镜像技术是指将整个数据库或者关键数据复制到另一磁盘上,并在数据库更新时保持镜像数据库与主数据库的一致性。事务故障与事务程序及所操作的数据有关,因为镜像数据库与主数据库完全一样,故不存在减少事务故障机率的问题。更新事务的执行需要同时修改镜像数据库和主数据库,不会提高并发库,只读事务可以由系统根据当前负荷选择读取镜像数据库或主数据库,以提高并发度。相对无镜像的数据库,更新主数据库后,为
数据库系统的故障分为三类:事务故障、系统故障和介质故障。事务故障是单独一个事务出问题而不能执行下去,并不影响其他事务的执行;系统故障是故障导致系统重启,当前运行中的事务及刚刚提交的事务会导致数据库不一致;介质故障则是数据库文件的存储介质如硬盘发生故障导致数据丢失。DBMS对不同类别的故障使用不同的恢复方法。其中事务故障和系统故障由DBMS来完成事务级别的恢复,即根据日志文件对未完成的事务进行UND
故障导致服务器重启,故障时正在执行的事务的原子性被破坏,即事务没有执行完,其对数据库的部分更新可能己经写入硬盘上的数据库文件,重启后这部分更新使得数据库处于不一致性状态,应对其进行处理,撤销故障时未完成的事务对数据库的更新,使数据库还原到未完成的事务执行前的状态,相当于这些事务没有执行。这种恢复操作借助于日志文件来完成。日志按照时间顺序记录了所有事务对数据库的更新操作。而且在对数据库的更新之前已被
(三)、故障事务内部更多的故障是非预期的,是不能由应用程序处理的。如运算溢出、并发事务发生死锁而被选中撤销该事务、违反了某些完整性限制等。“CPU故障”属于系统故障,系统故障是指造成系统停止运转的任何事件,使得系统要重新启动。例如,特定类型的硬件错误(CPU故障)、操作系统故障、DBMS代码错误和突然停电等。“硬盘损坏”属于介质故障,介质故障也称为硬故障(HardCrash)。硬故障是指外存故障,
概念模型是信息的描述方式,逻辑模型是数据的逻辑结构,数据模型是指数据的物理组织方式。逻辑模型(E-R图)中的联系描述的是实体间的关联关系,主要是现实世界中的事件,包括参与者和事件自身的属性。在关系模型中,取参与联系的实体的码(唯一代表具体的参与者)和事件自身的属性,构成记录即以关系的形式来描述。索引是为提高查询效率而引入的机制。通过对查询项建立索引表(包含查找项和指针,其中査找项进行排序或散列),
(二)、数据模型不同的数据模型具有不同的数据结构形式。目前最常用的数据结构模型有层次模型(hierarchical model)、网状模型(network model)、关系模型(relational Model)和面向对象数据模型(object oriented model)。其中层次模型和网状模型统称为非关系模型。非关系模型的数据库系统在20世纪70年代非常流行,在数据库系统产品中占据了主导地
在数据库系统中,模式用于对数据库中全部数据的逻辑结构和特征进行描述,即模式用于描述概念视图层次上的数据特性。外模式也称为用户模式或子模式,是用户与数据库系统的接口,是用户用到的那部分数据的描述,即外模式用于描述用户视图层次上的数据特性。内模式也称为存储模式,是数据物理结构和存储方式的描述,即内模式用于描述内部视图层次上的数据特性,是数据在数据库内部的表示方式。数据控制功能包括对数据库中数据的安全性
文档存储数据库是以文档为存储信息的基本单位,如BaseX,CouchDB,MongoDB等。键值存储数据库支持简单的键值存储和提取,具有极高的并发读写性能,如Dynamo, Memcached,Redis等。图形存储数据库利用计算机将点、线、面等图形基本元素按照一定的数据结构进行存储,如 FlockDB、Neo4j等。多值数据库系统是一种分布式数据库系统,提供了一个通用的数据集成与访问平台,屏蔽了
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号