全文搜索 Lucene.Net

原创

心冰之海 2021-07-24 18:36:45 ©著作权

文章标签 .Net 文章分类 .Net 后端开发

©著作权归作者所有：来自51CTO博客作者心冰之海的原创作品，请联系作者获取转载授权，否则将追究法律责任

Lucene简介

首先说明的是--Lucene.Net只是一个全文检索开发包，不是一个成型的搜索引擎，

它的功能就是负责将文本数据按照某种分词算法进行切词,分词后的结果存储在索引库中,从索引库检索数据的速度灰常快.

对以上加粗的词汇稍作下阐述：

文本数据：Lucene.Net只能对文本信息进行检索，所以非文本信息要么转换成为文本信息,要么你就死了这条心吧！

分词算法：将一句完整的话分解成若干词汇的算法常见的一元分词(Lucene.Net内置就是一元分词,效率高,契合度低),二元分词,基于词库的分词算法(契合度高,效率低)...

切词:将一句完整的话,按分词算法切成若干词语

比如："不是所有痞子都叫一毛" 这句话,如果根据一元分词算法则被切成: 不是所有痞子都叫一毛

如果二元分词算法则切成: 不是是所所有有痞痞子子都都叫叫一一毛

如果基于词库的算法有可能:不是所有痞子都叫一毛具体看词库

索引库:简单的理解成一个提供了全文检索功能的数据库

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯