From:http://liusuper.iteye.com/blog/219013

 

一、oracle的索引陷阱
    一个表中有几百万条数据,对某个字段加了索引,但是查询时性能并没有什么提高,这主要可能是oracle的索引限制造成的。oracle的索引有一些索引限制,在这些索引限制发生的情况下,即使已经加了索引,oracle还是会执行一次全表扫描,查询的性能不会比不加索引有所提高,反而可能由于数据库维护索引的系统开销造成性能更差。
下面是一些常见的索引限制问题。
 
1、使用不等于操作符(<>,!=)
    下面这种情况,即使在列dept_id有一个索引,查询语句仍然执行一次全表扫描
select * from dept where staff_num <> 1000;
    但是开发中的确需要这样的查询,难道没有解决问题的办法了吗?
    有!
    通过把用or语法代替不等号进行查询,就可以使用索引,以避免全表扫描;上面的语句改成下面这样的,就可以使用索引了。
select * from dept where staff_num < 1000 or dept_id > 1000;
 
2、使用is null或is not null
    使用is null或is not null也会限制索引的使用,因为数据库并没有定义null值。如果被索引的列中有很多null,就不会使用这个索引(除非索引是一个位图索引,关于位图索引,会在以后的blog文章里做详细解释)。在sql语句中使用null
会造成很多麻烦。
解决这个问题的办法是:建表时把需要索引的列定义为非空(not null)。
 
3、使用函数
    如果没有使用基于函数的索引,那么where子句中对存在索引的列使用函数时,会使优化器忽略掉这些索引。下面的查询就不会使用索引:
select * from staff where trunc(birthdate) = '01-MAY-82';
    但是把函数应用在条件上,索引是可以生效的,把上面的语句改成下面的语句,就可以通过索引进行查找。
select * from staff where birthdate < (to_date('01-MAY-82')+0.9999);
 
4、比较不匹配的数据类型
    比较不匹配的数据类型也是难于发现的性能问题之一。
    下面的例子中,dept_id是一个varchar2型的字段,在这个字段上有索引,但是下面的语句会执行全表扫描。
select * from dept where dept_id = 900198;
    这是因为oracle会自动把where子句转换成to_number(dept_id) = 900198,就是3所说的情况,这样就限制了索引的使用。把SQL语句改为如下形式就可以使用索引。
select * from dept where dept_id = '900198';
 
二,各种索引使用场合及建议
(1)B*Tree索引
常规索引,多用于oltp系统,快速定位行,应建立高cardinality列(即列的唯一值除以行数为一个很大的值,存在很少的相同值)。
create index indexname on tablename(columnname[columnname...])
(2)反向索引
    B*Tree的衍生产物,应用于特殊场合,在ops环境加序列增加的列上建立,不适合做区域扫描。
create index indexname on tablename(columnname[columnname...]) reverse
(3)降序索引
    B*Tree的衍生产物,应用于有降序排序的搜索语句中,索引中存储了降序排列的索引码,提供了快速的降序搜素。
create index indexname on tablename(columnname DESC[columnname...])
(4)位图索引
    位图方式管理的索引,适用于OLAP(在线分析)和DSS(决策处理)系统,应建立于低cardinality列,适合集中读取,不适合插入和修改,提供比B*Tree索引更节省的空间。
create bitmap index indexname on tablename(columnname[columnname...])
    在实际应用中,如果某个字段的值需要频繁更新,那么就不适合在它上面创建位图索引。在位图索引中,如果你更新或插入其中一条数值为N的记录,那么相应表中数值为N的记录(可能成百上千条)全部被Oracle锁定,这就意味着其它用户不能同时更新这些数值为N的记录,其他用户必须要等待第一个用户提交后,才能获得锁,更新或插入数据,bitmap index它主要用户决策支持系统或静态数据。
(5)函数索引
    B*Tree的衍生产物,应用于查询语句条件列上包含函数的情况,索引中存储了经过函数计算的索引码值。可以在不修改应用程序的基础上能提高查询效率。
 
三、索引创建策略
1、导入数据后再创建索引
2、不需要为很小的表创建索引
3、对于取值范围很小的字段(不如性别字段)应当建立位图索引
4、限制表中索引的数目
5、为索引设置合适的PCTFREE值
6、存储索引的表空间最好单独设定
 
唯一索引和不唯一索引都只是针对B树索引而言。
Oracle最多允许包含32个字段的复合索引。
由此估计出一个查询如果使用某个索引会需要读入的数据块块数。
需要读入的数据块越多,则cost越大,Oracle也就越有可能不选择使用index。
 
四、小结
能用唯一索引,一定用唯一索引
能加非空,就加非空约束
一定要统计表的信息,索引的信息,柱状图的信息
联合索引的顺序不同,影响索引的选择,尽量将值少的放在前面
只有做到以上四点,数据库才会正确的选择执行计划