引言:Oracle数据库性能调优最需要重视的也最常遇到的就是SQL执行效率,而反映SQL效率最直观的工具就是CBO生成的执行计划,那么如何让CBO生成最精准的效率最高的执行计划成为我们当前需要研究的课题。同一条语句,好的执行计划能带来飞一样的速度,坏的执行计划让我们痛苦不堪,下面我们从原理到实践来把如何产生高效计划的方法教给大家。

Oracle 数据分析和动态采样_oracle学习

一  CBO介绍


CBO全称叫Cost Based optimization基于代价优化器,它是一个数学模型,同一个SQL语句在不同的oracle版本中计算出来的代价结果也是不一样的,因为每个版本CBO优化器的设计结构有很大不同,现在还不是很完善很智能很通人性,因此我们不能完全依赖它,只能辅助我们。


如何生成精确的执行计划:公式数据+CBO=执行计划,传入CBO的数据越精确得到结果越精确,我们能做的保证输入数据更准确,通过精确数据计算出精确执行计划



二演示一个表分析后执行计划比动态采样更准确的例子


动态采样:顾名思义就是oracle自动为你进行的初步数据分析,由于是随机在表上取一些数据,因此并不能保证得出的执行计划很准确,只能作为一种辅助分析手段,在不得已的情况下来分析数据,有一定的局限性。


场景:当表没有分析信息时,oracle会使用动态采样技术,而且动态采样是在SQL硬解析的时候发生的,传入->CBO参数->生成执行计划。


级别:oracle 10g  oracle 11g默认动态采样级别是2,它有level1-10,设置的级别越高采集的数据块越多,结果越精确,运行时间越长,level10对所有数据进行采样分析。


实验


LEO1@LEO1> drop table leo1 purge;清理环境


Table dropped.


LEO1@LEO1> drop table leo2 purge;


Table dropped.


LEO1@LEO1> create table leo1 as select * from dba_objects;创建leo1表


Table created.


LEO1@LEO1> create table leo2 as select * from leo1;创建leo2表,采用leo1一样数据和结构


Table created.


LEO1@LEO1> col segment_name for a10


LEO1@LEO1> select segment_name,extents,blocks from dba_segments where segment_name in ('LEO1','LEO2');


SEGMENT_NA    EXTENTS    BLOCKS


---------- ---------- -------------- -------------- ----


LEO1              24      1152


LEO2              24      1152


查询leo1和leo2表这两个段对象存储参数,都是占用24个区,1152个块,2个表一模一样嘛


LEO1@LEO1> col table_name for a10


LEO1@LEO1> select table_name,num_rows,blocks,status from dba_tables wheretable_name in ('LEO1','LEO2');


TABLE_NAME  NUM_ROWS    BLOCKS STATUS


---------- ---------- ---------- ------------ ---------- ------------


LEO1                            VALID


LEO2                            VALID


在这个数据字典里只显示表名和当前状态(有效),没有行信息和块信息,这是为神马呢,嗯从上面的操作可以看出,我们只是建立了表,但没有分析表统计信息,现在我们分析一下后看看效果


LEO1@LEO1> execute dbms_stats.gather_table_stats('LEO1','LEO1');对LEO1表进行统计分析


PL/SQL procedure successfully completed.


LEO1@LEO1> select table_name,num_rows,blocks,status from dba_tables wheretable_name in ('LEO1','LEO2');


TABLE_NAME  NUM_ROWS    BLOCKS STATUS


---------- ---------- ---------- ------------ ---------- ------------


LEO1                    71968                1051      VALID


LEO2                                                              VALID


现在leo1表已经有行信息和块信息了,leo2由于没有进行表分析现在还什么都没有


LEO1@LEO1> set autotrace trace exp


LEO1@LEO1> select * from leo1 where object_id=10000;


Execution Plan


----------------------------------------------------------


Plan hash value: 2716644435


--------------------------------------------------------------------------


| Id  | Operation        | Name | Rows  | Bytes | Cost (%CPU)| Time    |


--------------------------------------------------------------------------


|  0 | SELECT STATEMENT  |      |    1 |    97 |  287  (1)| 00:00:04 |


|*  1 |  TABLE ACCESS FULL| LEO1 |  1|    97 |  287  (1)| 00:00:04 |


--------------------------------------------------------------------------


Predicate Information (identified by operation id):


---------------------------------------------------


  1 - filter("OBJECT_ID"=10000)


Leo1表进行了统计分析,执行计划显示Rows=1,嗯由于object_id字段是不重复的,我们都知道object_id=10000只有一条记录,这和执行计划的判断结果是一致,所以表分析可以让oracle收集表数据的信息,让CBO了解表数据分布情况,有多少条,占用多少空间等。

总之“分析”就是让oracle理解我们的数据是怎么样一个情况,以便更好的去处理它


LEO1@LEO1> select * from leo2 where object_id=10000;


Execution Plan


----------------------------------------------------------


Plan hash value: 2258638698


--------------------------------------------------------------------------


| Id  | Operation        | Name | Rows  | Bytes | Cost (%CPU)| Time    |


--------------------------------------------------------------------------


|  0 | SELECT STATEMENT  |      |    12 |  2484 |  287  (1)| 00:00:04 |


|*  1 |  TABLE ACCESS FULL| LEO2 |  12|  2484 |  287  (1)| 00:00:04 |


--------------------------------------------------------------------------


Predicate Information (identified by operation id):


---------------------------------------------------


  1 - filter("OBJECT_ID"=10000)


Note


-----


  -dynamic sampling used for this statement (level=2)


Leo2表没有进行统计分析,oracle采用了动态采样技术(红色字显示),执行计划显示Rows=12,由于动态采样只是随机在表上取一些数据来评估,没有进行全表完整分析,固然得出的执行计划没有leo1表更精确更好。所以说“动态采样”只是一个补救措施。