按物理结构划分,索引可分为顺序文件索引、B树索引和散列表索引。商用数据库产品的索引主要是B树索引和散列表索引。但顺序文件索引作为一种基本的索引数据结构也应当被关注。
顺序文件索引定义:以顺序文件的物理存储结构来存储的索引。即[键值,数据记录指针]对以数组的形式有序储存。
顺序文件索引原理:指针占用空间的大小远小于实际记录,可以支持快速扫描,尤其是在内存中快速扫描。
稀疏索引:如果表过大,将导致索引占用的空间也过大,因此有了稀疏索引,即并不是每个键值都出现在索引数组中。稀疏索引一定程度上牺牲了精确查找的效率,但提高了大表的查询效率。相对稀疏索引的是稠密索引。
多级索引:在一级索引(可以是稀疏或稠密的)上建立二级索引,提高效率。二级索引必然是稀疏的。
允许存在重复键的索引:和其他索引一样,顺序文件索引也允许键值重复。
主索引和辅助索引:对于主索引,数据记录和索引一样,都按照键值有序排列。对于辅助索引,数据记录的储存顺序和索引键值没有必然联系。辅助索引必然是稠密的。
利用桶技术减少索引占用空间:没有利用桶技术的索引,键值出现的次数等于表记录数。如果存在重复键值,将浪费大量空间。在索引块和数据块之间加入桶,可以解决这个问题。每个键值只在索引中出现一次,并指向属于该键值的桶。桶中存放指向数据记录的指针。
倒排索引和文档检索:倒排索引解决了以关键字为基础的文档检索问题。对于倒排索引,一个文档被视为一个记录,其中的关键字被视为属性,以关键字为键值建立多个索引,指向每个文档或文档中出现该关键字的位置。“倒排”的含义就是从关键字倒过来找到文档。倒排索引是互联网文档检索的核心技术。
索引降序排列 索引顺序表
转载本文章为转载内容,我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题,欢迎原作者联系我们进行内容更正或删除文章。
提问和评论都可以,用心的回复会被更多人看到
评论
发布评论
相关文章