一、定义Apache Solr 是一个可扩展的,可快速部署的,对搜索海量文本中心的数据和对返回结果做相关性排序方面做了优化的企业级搜索引擎。二、SOLR特点 可扩展性:Solr可以把建立索引和查询处理的运算分布到一个集群内的多台服务器上。快速部署:Solr是开源软件,安装和配置都很方便,可以根据安装包内的Sample配置直接上手。优化的搜索功能:Solr搜索够快。对于复杂的搜索
前面一篇开始学习solr的时候,做了个入门的示例 。虽然可以检索出内容,但总和想象的结果有差异——比如,检索“天龙”两个字,按常规理解,就应该只出来《天龙八部》才对,可是竟然也会把《倚天屠龙记》检出来。后来研究了一下,发现系统是这样处理的:无论是抽索引时还是分析检索词时,都把所有文字按单字拆开。这样,刚好《倚天屠龙记》里包含“天”和“龙”。于是对照solr的配置文件schema.xml做
(三)Solrj4到Solrj5的升级之路Solr5发布了,带来了许多激动人心的新特性,但Solrj的许多接口也发生了变化,升级是痛苦的,但也是必须的,下面就赶紧来看看有哪些代码需要升级吧。变化1:SolrServer变成了SolrClient应该说这个变化是合理的,毕竟Solrj就是一个客户端,命名为Server本身就有问题。这样一来,所有SolrServer系列的类都需要更改为SolrClie
转载 1月前
484阅读
浏览器界面操作:一、添加:如图添加相应内容后点击Submit Documents,出现图上所示success状态则表示添加成功。 二、修改:修改界面和添加界面一致,但是修改是通过先删除再添加新索引实现的。三、删除:使用xml方式输入删除的标签<delete>,再加上提交标签<commit>也可以使用<query>标签进行批量删除四、查询:1.q :qu
转载 2024-04-03 12:41:19
1619阅读
hanlp-portable.jar和hanlp-solr-plugin.jar共两个jar放入${webapp}/WEB-INF/lib下修改solr core的配置文件${core}/conf/schema.xml:Solr5中文分词器详细配置对于新手来说,上面的两步可能太简略了,不如看看下面的step by step。本教程使用Solr5.2.1,理论上兼容solr5.x。放置j
# Solr集成HanLP ## 简介 Solr是一个开源的搜索平台,它基于Lucene构建而成,提供了丰富的搜索功能和可扩展性。HanLP是由大连理工大学自然语言处理与社会人文计算实验室开发的开源中文自然语言处理工具包,它提供了包括分词、词性标注、命名实体识别、依存句法分析等在内的多种功能。 将SolrHanLP集成,可以使得Solr搜索更加智能化,提高搜索的准确性和效果。本文将介绍如何
原创 2023-09-29 18:14:36
147阅读
在 solr 3.5 配置及应用(一) 讲过一了 solr 3.5的详细配置,本节我们讲利用solr 的客户端调用solr的应用了!一、利用SolrJ操作solr API使用SolrJ操作Solr会比利用httpClient来操作Solr要简单。SolrJ是封装了httpClient方法,来操作solr的API的。SolrJ底层还是通过使用httpClient中的方法来完成So
1.solr简介  是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务。Solr可以独立运行在Jetty、Tomcat等这些Servlet容器中。使用Solr 进行创建索引和搜索索引的实现方法很简单,如下:创建索引:客户端(可以是浏览器可以是Java程序)用 POST 方法向 Solr 服务器发送一个描述 Field 及其内容的 XML 文档,Solr服务器根
转载 2023-12-26 13:43:37
39阅读
# 教你如何解决“Solr 查询 undefined field hanlp”问题 在处理Solr时,遇到“undefined field hanlp”这类问题可能会让初学者感到困惑。本文将带你深入理解如何在Solr中进行字段查询,并解决这个特定问题的步骤。我们会通过表格展示整个流程,然后逐步解释每一步应该如何操作,同时附上相应的代码示例。 ## 解决流程 | 步骤 | 描述
原创 8月前
10阅读
一、本文将solr安装在linux上。首先先安装好jdk和tomcat。配置环境:jdk8,tomcat8.5,solr7.2.1.。二、复制Solr文件夹中的一些文件到apache-tomcat下:1)将solr压缩包中solr\server\solr-webapp\文件夹下有个webapp文件夹,将之复制到tomcat\webapps\目录下,文件夹名改成solr(任意);cp-R/usr/l
原创 2018-10-29 19:31:29
3947阅读
SpringBoot整合Solr 入门(上)Solr是干什么的就不用多说了,直接进入正题:Solr下载链接:http://lucene.apache.org/solr/Solr的文件夹结构bin: solr的运行脚本 contrib : solr的一些贡献软件/插件,用于增强solr的功能。 dist : 该目录包含build过程中产生的war和jar文件,以及相关的依赖文件。 docs :
SpringBoot整合 HanLP的描述 在现代化应用系统中,自然语言处理(NLP)技术的应用越来越普及,HanLP作为一款优秀的中文NLP工具,特别适合于中文文本的语义分析和处理。在这个背景下,我决定结合SpringBoot框架和HanLP,打造一个高效的中文文本处理系统。本文将详细记录这一整合过程,包括技术痛点、演进历程、架构设计、性能攻坚、故障复盘和经验沉淀。 ### 背景定位 随着
Solr4.8.0源码分析(7)之Solr SPI查看Solr源码时候会发现,每一个package都会由对应的resources. 如下图所示:一时对这玩意好奇了,看了文档以后才发现,这个services就是java SPI机制。首先介绍下java SPI机制,然后再结合Solr谈一下SPI。1. JAVA SPI当服务的提供者,提供了服务接口的一种实现之后,在jar包的META-INF/serv
1、下载 solr版本必须和lucene版本一致,这个链接http://archive.apache.org/dist/lucene/是apache子项目库,在这里可以下载lucene,我这里使用的是5.0版本 注意6.0之后,官方推荐使用jdk8,tomcat8了。 2、启动 solr默认使用内
原创 2024-08-23 14:52:36
52阅读
摘要:本篇是本人在做一个大数据项目时,对于系统架构的一点总结,如何在保证存储量的情况下,又能保证数据的检索速度。前提:      Solr、SolrCloud提供了一整套的数据检索方案,HBase提供了完善的大数据存储机制。需求:      1、对于添加到HBase中的结构化数据,能够检索出来。      &
转载 2023-08-27 16:24:24
66阅读
(1)“:” 指定字段查指定值,如返回所有值*:*(2)“?” 表示单个任意字符的通配(3)“*” 表示多个任意字符的通配(不能在检索的项开始使用*或者?符号)(4)“~” 表示模糊检索,如检索拼写类似于”roam”的项这样写:roam~将找到形如foam和roams的单词;roam~0.8,检索返回相似度在0.8以上的记录。(5)邻近检索,如检索相隔10个单词的”apache”和”jakarta
  关于solr7.4搭建与配置可以参考 solr7.4 安装配置篇  在这里我们探讨一下分词的配置目录  关于分词  配置分词  验证成功1.关于分词  1.分词是指将一个中文词语拆成若干个词,提供搜索引擎进行查找,比如说:北京大学 是一个词那么进行拆分可以得到:北京与大学,甚至北京大学整个词也是一个语义  2.市面上常见的分词工具有 IKAnalyzer&nbsp
转载 2024-05-16 17:26:23
114阅读
一、 Apache Solr 简介Apache Solr 是Apache Lucene项目的开源企业搜索平台。其主要功能包括全文检索、命中标示、分面搜索、动态聚类、数据库集成,以及富文本(如Word、PDF)的处理。Solr是高度可扩展的,并提供了分布式搜索和索引复制。Solr是最流行的企业级搜索引擎,Solr 4还增加了NoSQL支持,还支持REST风格API。支持强大的匹配能力,如短语,通配符
这个地址有各个版本的 这次我使用的是5.5.4版本和tomcat8 版本5.5.4已结内置了jetty可以直接运行 直接运行如下
原创 2018-09-22 19:55:01
747阅读
Solr是一种基于Lucene的全文搜索引擎,有关Solr的详细内容请参考官方文档,这里不做详细说明,我们这里主要介绍Solr如何与Tomcat做整合。特别说明:本文中的Solr使用的是3.5.0,Tomcat版本为6.0(64 bit)。下面,我们就一起来实现Solr和Tomcat的整合吧。一、熟悉Solr1、准备环境这里我首先把Solr和Tomcat解压,拷贝到我的d:
原创 2015-11-18 23:51:39
116阅读
  • 1
  • 2
  • 3
  • 4
  • 5