DATE_FORMAT索引

转载

棉花糖 2024-08-21 07:51:42

文章标签 DATE_FORMAT索引 oracle 集群 disk service 文章分类 数据仓库大数据

1、之前的总结

关于索引的概念：

关于索引组织表：

索引段使用技巧：

索引跳跃式扫描：

本地和全局索引：

三索引性能比较：

2、分析索引结构

创建环境：

就用我们经典的t2表吧，

SQL> desc t2
名称是否为空? 类型
----------------------------------------- -------- ------------------
OBJECT_ID NUMBER
OBJECT_NAME VARCHAR2(128)

SQL> select count(*) from t2;
COUNT(*)
----------
48940

在t2表的object_id 列创建索引：

SQL> create index t2_idx on t2(object_id);
索引已创建。

找出这个索引对应的id号：

SQL> select object_id from dba_objectS where object_name='T2_IDX';
OBJECT_ID
----------
59676

根据这个id，把索引的结构dump出来：

SQL> alter session set events 'immediate trace name treedump level 59676';
会话已更改。

现在这个文件到哪了呢？我们这个会话是一个用户进程，（反正至少不是后台进程）所以dump出来的文件会在 udump 目录下。怎么找到对应的那个dunp出来的文件呢？可能你会说，根据时间排列一下，最接近现在的那个就是。。。。额。。。这样说算是有道理的，但是，问题是：如果有很多个用户进程都连接了，都进行了各种dump操作。。。这下这么多文件，时间几乎是同样的，怎么办？？

所以说，我们需要一个普遍，通用而准确的方法：
我们观察了一下这些文件的命名方式，大概都是这个样子的：orcl_ora_3488.trc 我们只看那个数字，这个数字是为这个用户进程服务的操作系统进程的ID（或线程id）。

ok，第一步，我们找到这个用户会话进程的id：

SQL> select distinct sid from v$mystat;

SID
----------
149

第二步，根据当前session的id （即 sid）找出为这个sid 服务的进程的地址：

SQL> select paddr from v$session where sid = 149;

PADDR
--------
6C8F0744

第三步，根据父进程的地址，找到父进程的id号，也就找到了跟踪文件的名字：

SQL> select spid from v$process where addr='6C8F0744';
SPID
------------
5508

好了，找到对应的文件：orcl_ora_5508.trc

打开文件：

Instance name: orcl
 Redo thread mounted by this instance: 1
 Oracle process number: 14
 Windows thread id: 5508, image: ORACLE.EXE (SHAD)
 *** 2012-10-08 13:05:00.968
 *** SERVICE NAME:(SYS$USERS) 2012-10-08 13:05:00.843
 *** SESSION ID:(149.18) 2012-10-08 13:05:00.843
 ----- begin tree dump
 branch: 0x40ec52 4254802 (0: nrow: 108, level: 1)    ——这一行其实就是根节点的开始。
    leaf: 0x40ec53 4254803 (-1: nrow: 485 rrow: 485)   ——叶子节点的开始，如果索引多的话，还会向下分一个等级，隔一段出现一个branch。
    leaf: 0x40ec54 4254804 (0: nrow: 479 rrow: 479)
    leaf: 0x40ec55 4254805 (1: nrow: 479 rrow: 479)
    leaf: 0x40ec56 4254806 (2: nrow: 479 rrow: 479)
    leaf: 0x40ec57 4254807 (3: nrow: 479 rrow: 479)
    leaf: 0x40ec58 4254808 (4: nrow: 479 rrow: 479)
    leaf: 0x40ec59 4254809 (5: nrow: 479 rrow: 479)
    leaf: 0x40ec5a 4254810 (6: nrow: 479 rrow: 479)
    leaf: 0x40ec5b 4254811 (7: nrow: 479 rrow: 479)
    leaf: 0x40ec5c 4254812 (8: nrow: 479 rrow: 479)
    leaf: 0x40ec5d 4254813 (9: nrow: 479 rrow: 479)
    leaf: 0x40ec5e 4254814 (10: nrow: 479 rrow: 479)
    leaf: 0x40ec5f 4254815 (11: nrow: 479 rrow: 479)
    leaf: 0x40ec60 4254816 (12: nrow: 479 rrow: 479)
    leaf: 0x40ec61 4254817 (13: nrow: 479 rrow: 479)
    leaf: 0x40ec62 4254818 (14: nrow: 479 rrow: 479)
    leaf: 0x40ec63 4254819 (15: nrow: 479 rrow: 479)
    leaf: 0x40ec64 4254820 (16: nrow: 479 rrow: 479)
    leaf: 0x40ec65 4254821 (17: nrow: 479 rrow: 479)
    leaf: 0x40ec66 4254822 (18: nrow: 472 rrow: 472)
    leaf: 0x40ec67 4254823 (19: nrow: 449 rrow: 449)
    leaf: 0x40ec68 4254824 (20: nrow: 449 rrow: 449)
    leaf: 0x40ec69 4254825 (21: nrow: 449 rrow: 449)
    leaf: 0x40ec6a 4254826 (22: nrow: 449 rrow: 449)
    leaf: 0x40ec6b 4254827 (23: nrow: 449 rrow: 449)
    leaf: 0x40ec6c 4254828 (24: nrow: 449 rrow: 449)
    leaf: 0x40ec6d 4254829 (25: nrow: 449 rrow: 449)
    leaf: 0x40ec6e 4254830 (26: nrow: 449 rrow: 449)
    leaf: 0x40ec6f 4254831 (27: nrow: 449 rrow: 449)
    leaf: 0x40ec70 4254832 (28: nrow: 449 rrow: 449)
    leaf: 0x40ec71 4254833 (29: nrow: 449 rrow: 449)
    leaf: 0x40ec72 4254834 (30: nrow: 449 rrow: 449)
    leaf: 0x40ec73 4254835 (31: nrow: 449 rrow: 449)
    leaf: 0x40ec74 4254836 (32: nrow: 449 rrow: 449)
    leaf: 0x40ec75 4254837 (33: nrow: 449 rrow: 449)。。。。。。。。。。。。。。。
 leaf: 0x40ed3d 4255037 (105: nrow: 449 rrow: 449)
    leaf: 0x40ed3e 4255038 (106: nrow: 297 rrow: 297)
 ----- end tree dump

恩，这就全部导出来了。。我们拿出一行来分析一下：

就叶子块的第一行吧：leaf: 0x40ec53 4254803 (-1: nrow: 485 rrow: 485)

leaf 不用解释，就是指的叶子节点。下面ox40ec53 是十六进制数，等于后面的十进制数4254803，指示了这个索引块所在的数据文件和数据块号。oracle有专门的函数来转换进制和包来转换块号。

SQL> select to_number('40ec53','xxxxxxx') from dual;
 TO_NUMBER('40EC53','XXXXXXX')
 -----------------------------
                       4254803SQL> select dbms_utility.data_block_address_file(4254803) from dual;

 DBMS_UTILITY.DATA_BLOCK_ADDRESS_FILE(4254803)
 ---------------------------------------------
                                             1

 SQL> select dbms_utility.data_block_address_block(4254803) from dual;

 DBMS_UTILITY.DATA_BLOCK_ADDRESS_BLOCK(4254803)
 ----------------------------------------------
                                          60499

这下，可以看到这个索引在1号数据文件的60499块内了。

我们通过dba_extents这个数据字典视图核实一下这个60499块是不是有这个索引。

SQL> select * from dba_extents where segment_name='T2_IDX'

DATE_FORMAT索引_service

可以看到从block_id 列，起始的60497向后数出8个，算是一个extent，都是段名子为T2_IDX的数据。也就是我们之前查询的也在这个extent里面。

刚才我们dump出来的是索引对象。（dump出的是一个对象，很多块），现在我们dump一个块出来，就是60499那个块。看看里面存了什么数据。（如果另起一个session的话，就会重新建一个dump文件，如果还用现在的session ，即 sid=149 ，就还在那个文件里。这个无所谓的）。。

执行：

SQL> alter system dump datafile 1 block 60499;
系统已更改。

进入用户dump目录找到对应的文件，打开：

*** 2012-10-08 14:51:06.375
 Start dump data blocks tsn: 0 file#: 1 minblk 60499 maxblk 60499
 buffer tsn: 0 rdba: 0x0040ec53 (1/60499)
 scn: 0x0000.00b09e2e seq: 0x01 flg: 0x04 tail: 0x9e2e0601
 frmt: 0x02 chkval: 0x62a2 type: 0x06=trans data
 Block header dump:  0x0040ec53
  Object id on Block? Y
  seg/obj: 0xe91c  csc: 0x00.b09e2b  itc: 2  flg: -  typ: 2 - INDEX
      fsl: 0  fnx: 0x0 ver: 0x01
  
  Itl           Xid                  Uba         Flag  Lck        Scn/Fsc
 0x01   0x0000.000.00000000  0x00000000.0000.00  ----    0  fsc 0x0000.00000000
 0x02   0xffff.000.00000000  0x00000000.0000.00  C---    0  scn 0x0000.00b09e2b
  
 Leaf block dump
 ===============
 header address 105906780=0x650025c
 kdxcolev 0
 KDXCOLEV Flags = - - -
 kdxcolok 0
 kdxcoopc 0x80: opcode=0: iot flags=--- is converted=Y
 kdxconco 2
 kdxcosdc 0
 kdxconro 485                      ——这个说明本块一共存了485行数据，可以从下面的row# 进行验证。
 kdxcofbo 1006=0x3ee
 kdxcofeo 1834=0x72a
 kdxcoavs 828
 kdxlespl 0
 kdxlende 0
 kdxlenxt 4254804=0x40ec54
 kdxleprv 0=0x0
 kdxledsz 0
 kdxlebksz 8036    ——这个块的大小。
 row#0[8024] flag: ------, lock: 0, len=12   ——这类似于一个二维表，每一行，两列，分别是col0，col1，具体意思见下面我的分析。
 col 0; len 2; (2):  c1 03
 col 1; len 6; (6):  00 40 ea 4a 00 2d
 row#1[8012] flag: ------, lock: 0, len=12
 col 0; len 2; (2):  c1 04
 col 1; len 6; (6):  00 40 ea 4a 00 05
 row#2[8000] flag: ------, lock: 0, len=12
 col 0; len 2; (2):  c1 05
 col 1; len 6; (6):  00 40 ea 4a 00 2e
 row#3[7988] flag: ------, lock: 0, len=12
 col 0; len 2; (2):  c1 06
 col 1; len 6; (6):  00 40 ea 4a 00 19
 row#4[7976] flag: ------, lock: 0, len=12
 col 0; len 2; (2):  c1 07
 col 1; len 6; (6):  00 40 ea 4a 00 14
 row#5[7964] flag: ------, lock: 0, len=12
 col 0; len 2; (2):  c1 08
 col 1; len 6; (6):  00 40 ea 4a 00 10
 row#6[7952] flag: ------, lock: 0, len=12
 col 0; len 2; (2):  c1 09
 col 1; len 6; (6):  00 40 ea 4a 00 21
 row#7[7940] flag: ------, lock: 0, len=12
 col 0; len 2; (2):  c1 0a
 col 1; len 6; (6):  00 40 ea 4a 00 0c
 row#8[7928] flag: ------, lock: 0, len=12
 col 0; len 2; (2):  c1 0b
 col 1; len 6; (6):  00 40 ea 4a 00 22
 row#9[7916] flag: ------, lock: 0, len=12
 col 0; len 2; (2):  c1 0c
 col 1; len 6; (6):  00 40 ea 4a 00 35
 row#10[7904] flag: ------, lock: 0, len=12
 col 0; len 2; (2):  c1 0d
 col 1; len 6; (6):  00 40 ea 4a 00 25
 row#11[7892] flag: ------, lock: 0, len=12
 col 0; len 2; (2):  c1 0e
 col 1; len 6; (6):  00 40 ea 4a 00 0b
 row#12[7880] flag: ------, lock: 0, len=12
 col 0; len 2; (2):  c1 0f
 col 1; len 6; (6):  00 40 ea 4a 00 13。。。。。。。。。。。。。。。。。。
row#481[1873] flag: ------, lock: 0, len=13
 col 0; len 3; (3):  c2 06 07
 col 1; len 6; (6):  00 40 ea 4b 00 7d
 row#482[1860] flag: ------, lock: 0, len=13
 col 0; len 3; (3):  c2 06 08
 col 1; len 6; (6):  00 40 ea 4b 00 7e
 row#483[1847] flag: ------, lock: 0, len=13
 col 0; len 3; (3):  c2 06 09
 col 1; len 6; (6):  00 40 ea 4b 00 7f
 row#484[1834] flag: ------, lock: 0, len=13
 col 0; len 3; (3):  c2 06 0a
 col 1; len 6; (6):  00 40 ea 4b 00 80
 ----- end of leaf block dump -----
 End dump data blocks tsn: 0 file#: 1 minblk 60499 maxblk 60499

以上便是导出索引块的结果，下面分析索引块的内容。先看看每一行中两列的意思。拿出两列来分析分析：

row#0[8024] flag: ------, lock: 0, len=12  
 col 0; len 2; (2):  c1 03
 col 1; len 6; (6):  00 40 ea 4a 00 2d
 row#1[8012] flag: ------, lock: 0, len=12
 col 0; len 2; (2):  c1 04
 col 1; len 6; (6):  00 40 ea 4a 00 05

先看长度 len 2 的那列：c1 03 这是什么呢？猜测下，是不是我们的索引键object_id 呢？？恩，答案是是的。那我们如何证明呢？

SQL> select object_id,rowid from t2 where object_id=2;
  OBJECT_ID    ROWID
 ----------     ------------------   2         AAAOiuAABAAAOpKAAt

我们把这个object_id=2(十进制)转换成十六进制：

SQL> select dump(2,16) from dual;
 DUMP(2,16)
 -----------------
 Typ=2 Len=2: c1,3

这里type=2 表示number类型的2，十进制的2，len=2长度为2，占用两个字节。也就是说2这个十进制数，在数据库块内的存放位置就是c1 03 。

继续看col1 中的数据：00 40 ea 4a 00 2d 长度为6，这个会是神马呢？很明显，几乎确定是rowid的十六进制写法。如何证明出来与 AAAOiuAABAAAOpKAAt 是相同的呢？？

先把十六进制数写作二进制吧：00 40 ea 4a 00 2d = 00000000 01000000 11101010 01001010 00000000 00101101

这rowid ：AAAOiu AAB AAAOpK AAt

二进制的前十位代表的是数据文件（数据段）编号00000000 01 = 1 就是1号文件。也就是rowid 中的 AAB 很明显 B 也代表1 。哦了。

二进制的11位后数22位，代表的块编号：000000 11101010 01001010 = 59978 。而AAAOpK 代表的十进制数是：14*64*64+41*64+10=59978 证明是相同的。

二进制最后16位。代表行号：00000000 00101101=45 ； rowid最后三位AAt 十进制为 45 。搞定了。

也就是说，col1 列存储的是rowid 的后面三部分，为什么没存储第一部分（段所在空间），没必要，因为在创建索引的时候已经做了关联，也就是说，我们没有必要为一本书的每个目录前面加上书的名字。

附上64进制rowid对应的十进制数字表：

DATE_FORMAT索引_service_02

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：数据库脱敏 java开源方案 mysql数据库脱敏

下一篇：mysql函数根据分隔符进行拆分 mysql 分割

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

DATE_FORMAT索引

DATE_FORMAT索引

51CTO博客