DB2 v8 db2look生成的用与构造统计信息的SQL有重复语句

DB2 v8 db2look提供了-m参数用于导出统计信息,可用于还原或构造测试优化器行为。 但是我们发现一个很奇怪的问题。db2look生成的用于构造统计信息的SQL语句有完全重复的语句存在。

db2inst1[@db2]():>db2look -d sample -m -t orders 

-- No userid was specified, db2look tries to use Environment variable USER
-- USER is: DB2INST1
-- The db2look utility will consider only the specified tables 
-- Running db2look in mimic mode
-- This CLP file was created using DB2LOOK Version 8.2
-- Timestamp: Tue Aug 30 08:58:16 BEIST 2016
-- Database Name: SAMPLE         
-- Database Manager Version: DB2/AIX64 Version 8.2.9       
-- Database Codepage: 1386
-- Database Collating Sequence is: UNIQUE


CONNECT TO SAMPLE;

---------------------------------------------

-- Mimic Tables, Columns, Indexes and Column Distribution

---------------------------------------------

-- Mimic table ORDERS


# 这里开始是第一部分
RUNSTATS ON TABLE "DB2INST1    "."ORDERS" ;

UPDATE SYSSTAT.INDEXES
SET NLEAF=-1,
    NLEVELS=-1,
    FIRSTKEYCARD=-1,
    FIRST2KEYCARD=-1,
    FIRST3KEYCARD=-1,
    FIRST4KEYCARD=-1,
    FULLKEYCARD=-1,
    CLUSTERFACTOR=-1,
    CLUSTERRATIO=-1,
    SEQUENTIAL_PAGES=-1,
    PAGE_FETCH_PAIRS='',
    DENSITY=-1,
    AVERAGE_SEQUENCE_GAP=-1,
    AVERAGE_SEQUENCE_FETCH_GAP=-1,
    AVERAGE_SEQUENCE_PAGES=-1,
    AVERAGE_SEQUENCE_FETCH_PAGES=-1,
    AVERAGE_RANDOM_PAGES=-1,
    AVERAGE_RANDOM_FETCH_PAGES=-1,
    NUMRIDS=-1,
    NUMRIDS_DELETED=-1,
    NUM_EMPTY_LEAFS=-1
WHERE TABNAME = 'ORDERS' AND TABSCHEMA = 'DB2INST1    ';

...
# 奇怪的问题在这里,输出中,完全一致的SQL语句出现了两次

-- Mimic table ORDERS 

# 这里开始是第二部分
RUNSTATS ON TABLE "KGDB    "."ORDERS" ;

UPDATE SYSSTAT.INDEXES
SET NLEAF=-1,
    NLEVELS=-1,
    FIRSTKEYCARD=-1,
    FIRST2KEYCARD=-1,
    FIRST3KEYCARD=-1,

我们通过逐条对比第一部分和第二部分的SQL语句,发现它们是完全一样的。

这里有两个问题,我们导入统计信息,除了还原原有的统计信息外,还有一个目的是节省时间,用runstats收集统计信息,对大表来说,时间还是非常可观的。

但生成的SQL语句的最开始却是进行runstats,这是为什么呢?接下来的SQL语句给了我们答案,这里用 了update语句来’导入‘旧的统计信息。假设,我们不在开始的部分进行runstats的操作,如果恰好表完全没有收集过统计信息,我们可以预见,update的操作会失败,统计信息导入操作也会失败。

第二个问题是,为什么需要执行两次runstats和两次的update操作。 这个问题,没有找到确切的答案,但是我们从v9.7上发现一些蛛丝马迹。

DB2 v9.7 db2look生成的用与构造统计信息的SQL正常

我们通过在v9.7上用db2look生成的用与构造统计信息的SQL语句,发现该SQL语句正常,只有一次runstats和一次的upate操作。因此我们猜测v8生成重复的SQL语句,可能是v8的bug。

是否可以做的更好

db2look生成的用于构造SQL语句的脚本,是否可以不包含runstats语句,我们可以把update语句换成一个delete和一个update语句?直接写入统计信息数据,减少runstats的时间。