文章目录1. 索引1. BSBI算法2. SPIMI算法3. BSBI与SPIMI的区别3. 动态索引构建 1. 索引建立倒排索引的过程称为索引构建,负责构建索引的算法称为索引器。操作系统往往以数据块为单位对数据进行读写,因此从磁盘读取一个字节和读一个数据块所耗费的时间可能一样多。采用一种高效的解压缩算法对数据进行压缩,然后读取磁盘上的压缩数据,再进行解压,这个过程所花的时间往往会比直接读取原始
转载 2024-04-17 14:36:59
134阅读
【阅读笔记】《信息检索导论》第四章 索引构建基于块的排序索引方法BSBI算法(blocked sort-based indexing)内存式单遍扫描索引构建方法SPIMI 算法(single-pass in-memory indexing)分布式索引构建方法MapReduce-基于词项分割动态索引构建方法主索引+辅助索引索引的合并周期性地对文档集进行重构其他索引类型 基于块的排序索引方法-面向静