oracle执行计划解释

精选转载

hsbxxl 2012-01-13 17:18:31 博主文章分类：Oracle

文章标签 网络 oracle 职场休闲计划 文章分类 Oracle 数据库

本文转载于网络，方便自己查询使用。

一.相关概念
    1·rowid，伪列：就是系统自己给加上的，每个表都有一个伪列，不并不是物理存在。它不能修改，删除，和添加， rowid在该行的生命周期是唯一的，如果向数据库插入一列，只会引起行的变化，但是rowid并不会变。
    2·recursive sql概念：当用户执行一些SQL语句时，会自动执行一些额外的语句，我们把这些额外的SQL语句称为 “recursive calls” 或者是“recursive sql statement”,当在执行一个DDL语句时，Oracle总会隐含的发出一些Recursiv sql语句，用于修改数据字典，如果数据字典没有在共享内存中，则就执行“resursive calls”，它会把数据字典从物理读取到共享内存。当然DML和select语句都可能引起recursive SQL。
    3·row source 行源：在查询中，由上一操作返回的符合条件的数据集，它可能是整个表，也可能是部分，当然也可以对2个表进行连接操作（join）最后得到的数据集
    4·predicate:一个查询中的where限制条件
    5·driving table 驱动表：该表又成为外层表，这个感念用于内嵌和HASH连接中，如果返回数据较大，会有负面影响，
       返回行数据较小的适合做驱动表
    6·probed table 被探查表：该表又称为内层表，我们在外层表中取得一条数据，在该表中寻找符合连接的条件的行。
    7·组合索引（concatenated index）由多个列组成的索引，在组合索引中有一个重要的概念，就是引导索引，
            create index idx_tab on tab(col1,col2,col3),
            indx_tab则称为组合索引，
            col1则称为引导列
      在查询条件where后，必须使用引导索引，才会使用该组合索引
    8.可选择性（selectivity）比较一下列中唯一键的数量和表中的行数，就可以判断该列的可选择性。如果该列的“
     唯一键的数量/表中的行数”的比值越接近1，则该列的可选择性越高，该列就越适合创建索引，同样索引的可选择性也越高。
     在可选择性高的列上进行查询时，返回的数据就较少，比较适合使用索引查询。
        二.Oracle访问数据的存取方法
    1.全表扫描(Full tabel scans,FTS)
            为了实现全表扫描，Oracle读取数据库中的每一行，并检查每一行是否满足语句的where限制条件一个多块读操作，
            可以使io能读取多块数据块。减少了IO次数，提高了系统的吞吐量。在多块读的方法的使用下，可以高效的实现
            数据库全表扫描，而且，中有在全表扫描的情况下，在可以使用多块读的方法。在这个种访问模式下，数据块只
            读一次。
             【注意】
            使用FTS的前提是，在较大的表中，不建议使用FTS,除非取出的数据较多，超过总量的5%-10%，或者使用并行查询时
    2.通过rowid的表存取
            行的ROWID指向了该行的数据文件，数据块，以及在数据块中的位置，使用rowid能快速的定位到要取得数据的行上，
            在Oracle中，这是取得单行最快的方式。
            【注意】
            该存取方法，不会用到多块读操作，一次IO只能读取一个数据块。
    3.索引扫描(index scan 和 index lookup)
            索引扫描时通过index查找到对应行的rowid，然后通过rowid从数据库中得到具体的数据。该方法分为两个步骤，
            （1）扫描索引得到得到rowid
        说明：索引中不止储存着索引值，还存放的行的rowid
            （2）通过rowid得到表中的数据
            【注意】
             1.由于索引经常使用，因此绝大多数都Cache到内存当中，所以第一步通常是逻辑IO,即数据可以从内存中取得
            2.但是对第二步来说，如果数据比较大，就不可能存放在内存，因此是个物理操作，是极其耗时间的，因此，从大表中
            进行索引扫描，如果数量大于总数的5%-10%,则效力会下降很多
            3.如果索引的数据都能在表中能找到，就可以避免第二步操作，避免了不必要的IO。效力会很高。
            4.如果SQL语句会对索引排序，因为索引已经预先排好了戏，索引在执行计划中不需要在对索引排序。
    根据索引的类型与where限制条件的不同，有4种数据类型的索引
            1.唯一索引(index unique scan)
        通过唯一索引查找一个数值，通常是rowid,如果表中存在unique,或者是primary key的话，Oracle通常实现
        唯一索引
            2.索引范围扫描（index range scan）
        如果要取得多行数据，通常在唯一索引上加上范围操作，例如（>,<）
        *使用index rang scan的三种情况
        (a)在唯一索引上有where条件筛选
        (b)在组合索引上，使用部分列进行查询，导致查询出多行
        (c)对非唯一索引列进行的任何查询
            3.索引全扫描(index full scan)
        与全表扫描想对应的就是全索引扫描，它必要保证要取得的数据都从索引中直接得到
        例：
        Index BE_IX is a concatenated index on big_emp （empno， ename）
           SQL> explain plan for select empno， ename from big_emp order by empno，ename；
            4.索引快速扫描(index fash full scan)
        索引快速扫描和index full scan相似，不会对查询出的数据进行排序。
        三.表之间的连接
     根据row source连接的条件不同，可以分为等值连接（where a.col3=b.col4）非等值连接（where a.col3>b.col4）外连接
    (where a.col3=b.col4(+))
    1.典型的连接类型
            (a)排序--合并连接（sort merge join,SMJ）
            (b)嵌套循环(nested loops,NL)
            (c)哈希连接(hash join,)
    A.排序--合并连接
            1)首先生成row source1需要的数据，让后对连接关联的列进行排序。
            2)然后生成row source2需要的数据，然后对这些数据按照与row socurce1相对应的操作关联列进行排序。
            3)将两边排好序的数据进行合并操作，将2个row source按照连接条件连接起来。
            [注意]
            ·.如果row source已经在关联上列上被排序，那个连接操作就不会执行sort操作，将大大的提高效率，因为排序时极其
   消耗资源的，预先被排序的row source包括索引,或者已经排好序的列。
            ·.排序是非常耗时的操作，尤其是大表，基于这个原因，SMJ通常不是一个好的解决办法，如果排序的工作早已做好
   那将极大的提高效率
  ·.对于非等值连接，这种连接方式的效率是比较高的。
    B.圈套循环。
            在连接有驱动表的概念，实际上连接过程就是2层嵌套循环，所以外层表的值也少也好。
            [执行原理]
        从内部表来看，需要得到外层表的每一行，去匹配内部表的所有行，因此保持外部表竟可能小，和高效率访问内部表，是
        连接性能的关键。
            [优点]
        nested loops可以返回已经连接的行，而不必等待所有的行连接完，因此能快速响应，特别适合用在
        需要快速响应的语句中。
         C.hash join
            较小的row source用来构建hash table和bitmap,而第二个用来被hansed,并与第一个生成的hash table进行匹配。 bitmap用来作为一种较快查询的方法，用来检查hash table是否有匹配的行，特别在表大的情况下，不能容纳在内存中，这个连接方法非常有效。这个链接，也有驱动表的概念，有来构造hash table,bitmap的表叫驱动表，如果被
构建的hash table,bitmap都能容纳在内存中，这个效率非常高。
            【注意】
       1)要使哈希连接有效，需要设置HASH_JOIN_ENABLED=TRUE，缺省情况下该参数为TRUE，另外，不要忘了还要设置 hash_area_size参数，以使哈希连接高效运行，因为哈希连接会在该参数指定大小的内存中运行，过小的参数会使哈希连接的性能比其他连接方式还要低
   2)只能用于等值连接。
   3)在2个较大的row source之间连接时会取得相对较好的效率，在一个row source较小时则能取得更好的效率。

        解释结果
    1.AND-EQUAL 该步骤具有两个或更多个子步骤，每一个子步骤返回一系列的ROWID.AND-EQUAL操作选择的是索引子操作返回的rowid
    2.BITMAP
          conversoin to rowids --将位图从位图索引转换成可以用于提取实际资料的一系列的ROWID
            conversoin from rowids --将一系列的ROWID转换成位图表示
            conversoin count --对位图的行数进行统计
            index single scan --为单个索引提取位图
            index range scan --返回的位图是一定范围的关键值
            index full scan --扫描整个位图索引
            MERGE        --合并连个位图，并作为一个位图返回结果
            Minus --该操作是merge的相反操作，而且可以具有两个或3个字操作并返回位图
        第一个子操作返回的位图用作起点，第一个位图减去第二个位图中提供的所有行。如果第二个位图为空，那么所有的
        null列也将被减去。
        or --将两个位图作为输入
    3.connect by --分层提取行，因为查询采用了CONNECT BY C从句
    4.concatenaction --合并多个行集为一行。
    5.count --计算从表中也选择的行数
            stopkey --计算的行数被查询语句中的where 中的 rownum所限制
    6.filter --将一系列的行数作为输入，并过滤到where从句查询而得到的结果
    7.firsh row --提取查询结果集的第一行
    8.for udpate -- 为提取的行加锁。
    9.hash join --使用散列连接法连接两张表
    10.index
            unique --从索引中查找唯一值
            range scan --从一定范围中查找，是按照升序的方式
            range scans desc --扫描行在一定范围之内，但是是按照降序的方式
    11.inlist iterator --在in谓词中为一个值执行一次或者多次操作
    13 intersection --将两个结果集合并成一个集，并返回在它们之间出现的共同的值
    14 merger join --提供共同值，用来连续两个结果集的结果。是内连接
             output --外
             anit --反
             seml --半
    15 nosted loops --该操作涉及到2个子程序的操作，第一个返回一个行集，在用行集中的每一行，执行第二个子操作。
            output --用于执行外部圈套循环
    16 partition [分区] --执行一个或者多个分区操作，partition-start,partition-stop将提供分区的范围
        singnal --显示操作将在单个分区上执行
        iterator        --在许多个分区中执行
        all --显示操作将在所有分区上执行
        inlist --显示操作在分区上执行，并用IN谓词驱动
    17 projection --采用多个查询作为输入，并返回单个记录集。常和intersection,minus, unqie使用
    18 sort
            aggregate --在行集上采用分组函数
            unique --对行集排序，去掉重复的行
            join -- 和merger相同
            group up -- 分组排序
            orday by --按照orday by进行排序
    19 table access
        full --显示指定表中的所有行
        cluster --与特定索引键进行匹配的所有行
        hash --散列
        by rowid --显示oracle表将从rowid提取
    20 unqie 显示两个集，并去掉重复行
    21 view 产生视图，并返回结果行集。