收集统计信息可以用dbms_stats包,通常用这样的语法:exec dbms_stat.gather_table_stats(ownname=>'xxx', tabname=>'xxx', estimate_percent=>xxx, method_opt=>'xxx', cascade=>xxx);


其中estimate_percent表示选择的采样比例,如果太低,收集速度会快,但可能不会很准确,如果太高,收集速度会慢,但比较准确,各有利弊。但同时也支持默认方式:exec dbms_stat.gather_table_stats(ownname=>'xxx', tabname=>'xxx');,那这里收集的采样比例是多少呢?


做个实验:

SQL> create table t2 as select * from dba_objects;
Table created.

SQL> select count(*) from t2;
  COUNT(*)
----------
     11218


SQL> create index idx_t2 on t2(object_id);
Index created.


SQL> exec dbms_stats.gather_table_stats(ownname=>'SYS', tabname=>'T2');
PL/SQL procedure successfully completed.


查询dba_tables表,看到NUM_ROWS值是11218,说明此处采样比例是100%。

--此处理解有误,按照官方文档的介绍,estimate_percent默认值是DBMS_STATS.AUTO_SAMPLE_SIZE,由Oracle根据算法判断设置的采样比例,并不是默认为100%,感谢@msdnchina指正,欢迎朋友们继续指教!

使用dbms_stat采集统计信息时estimate_percent和cascade的默认值_统计信息采集

再查询dba_indexes表,看到索引IDX_T2的相关统计列已经有值了,说明索引也进行了分析,即CASCADE默认值是TRUE。

再次查询dba_ind_columns表,看到列已经有了值,例如:COLUMN_POSITION、COLUMN_LENGTH等,也证明了CASCADE默认值是TRUE。


总结:

使用dbms_stats.gather_table_stats(ownname=>'SYS', tabname=>'T2');方式采集统计信息,

1、estimate_percent值默认是100%(其实estimate_percent可以设置为NULL,和100%作用相同,我理解NULL和不设这个值也相同,根据三段论传递,那么不设estimate_percent即默认是100%)。

2、CASCADE默认值是TRUE,即会对表、索引和列都会进行分析采集统计信息。