一、 SOLR搭建企业搜索平台 运行环境: 运行容器:Tomcat6.0.20 Solr版本:apache-solr-1.4.0 分词器:mmseg4j-1.6.2 词库:sogou-dic 准备工作: 下载tomcat 6.0.20:://tomcat.apache.o...
转载
2015-05-08 00:47:00
87阅读
项目介绍Springboot2.1+Solr7.5搭建的企业级搜索平台,项目目前支持文档内容和数据库检索,已经集成分词技术。支持文档内容检索类型包含:pdf、doc、docx、ppt、pptx、txt、log等 数据库已支持MySQL增量自动建立索引项目特点SpringBoot2.1Solr7.5thymeleafwebflux部署教程solr安装启动进入 solr-7.5.0/bin目录执行 s
原创
2020-12-30 10:12:39
387阅读
中文分词器安装
1)下载分词器,下载地址: http://code.google.com/p/mmseg4j/downloads/list(版本自己选择吧,我用的是1.8.5)
2)解压mmseg4j-1.8.5.zip,将mmseg4j-all-1.8.5.jar和dist中的mmseg4j-solr-1.8.5.jar一并复制到tomcat的webapps\solr\
原创
2012-04-13 18:14:23
1945阅读
前提是已经安装了java的环境,环境变量的配置不做为讲解,网上也有大量资料.下面以linux为例来说明如何搭建好一个solr
1)首先下载solr,下载地址:http://mirror.bit.edu.cn/apache/lucene/solr/
2)准备运行容器,我用的是tomcat-7.0.27.
也可以不用准备专门的容器,只需解压好solr,找到
原创
2012-04-13 17:14:26
1160阅读
点赞
1》找到solr下载包中的example文件夹,在它的下面有个multicore文件夹,将这个文件夹下面的所有东西copy到 c:\solr-tomcat\solr下面。注意:有一个 solr.xml(这只是默认文件,当然也可以指定别的文件),如: <?xml version="1.0" encoding="UTF-8" ?>
<solr persistent="f
原创
2023-05-16 01:08:20
110阅读
企业搜索是一个广泛的工具,用来搜索企业中的信息。该系统通过使用单个查询来帮助查找结构化和非结构化数据。它可以帮助组织检索,存储和跟踪企业中的各种信息。该系统使用户能够从不同的存储位置查询信息。它还以易于访问所需数据类型的方式对信息进行排名。最佳企业搜索引擎服务器:Datafari 下载: https://github.com/francelabs/d
转载
2023-09-08 09:28:46
141阅读
01—Springboot2.1+Solr7.5搭建的企业级搜索平台,项目目前支持文档内容和数据库检索,已经集成分词技术。支持文档内容检索类型包含:pdf、doc、docx、ppt、pptx、txt、log等数据库已支持MySQL增量自动建立索引。02—Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格
原创
2020-12-28 08:53:15
170阅读
1 背景做搜索引擎有有2年时间了,算是有个基本的入门。决定写一个系列博客,记录下自己所认识的搜索引擎,也希望对新入行的朋友有些帮助。2 概述搜索与推荐互联网上有海量的信息,从互联网上获取信息或娱乐,最主要的2个途径就是搜索和推荐。搜索:是用户主动去查询与获取自己想要的信息,用户有明确的意图,知道自己想要什么。基本所有app的首页,都会有一个搜索框,提供搜索功能。推荐:web或app主动向用户推荐他
转载
2023-10-24 14:51:02
117阅读
作者: Prabhakar Raghavan 在过去十年,搜索产业的驱动力主要是广告平台的发展。但到目前为止,搜索已经不仅是计算技术,而更是经济学的范畴了。尽管目前对于文本内容的搜索还是非常普遍,但用户的需求已经发生了改变:随着互联网的发展,用户不再满足于互联网带来的新鲜感,而是希望互联网为他们提供捷径来解决问题,让生活更便捷。比如找房子、订电影票、找度假信息等。但传统的搜索
转载
2023-11-08 23:20:51
44阅读
1》 首先下载好solr,我用的是 solr1.3,下载地址:windows版本http://labs.xiaonei.com/apache-mirror/lucene/solr/1.3.0/apache-solr-1.3.0.ziplinux版本http://labs.xiaonei.com/apache-mirror/lucene/solr/1.3.0/apache-so...
原创
2023-05-16 01:07:54
101阅读
新建java项目,使用的jar 有下载的solr下面的dist下面的solr-solrj-xxx.jar包和下面的solrj-lib下面的所有包代码如下 packag
原创
2023-05-16 00:17:41
74阅读
运行solr是个很简单的事,如何让solr高效运行你的项目,这个就不容易了。要考虑的因素太多。这里很重要一个就是对solr的配置要了解。懂得配置文
原创
2023-05-16 01:08:30
117阅读
随着信息技术的飞速发展,搜索引擎作为信息获取的重要工具,扮演着不可或缺的角色。阿里云 AI 搜索开放平台以其强大的技术支持和灵活的开放性,持续为用户提供高效的搜索解决方案。一、阿里云 AI 搜索开放平台一站式的 AI 搜索开放平台作为阿里云 AI 搜索整个产品体系核心,提供丰富的 AI 搜索组件化服务。兼容主流开发框架 LangChain和 LlamaIndex,支持搜索专属大模型、百炼
简介Elastic Workplace Search 提供了一个统一的搜索体验,从而便于任何人在任何时间找到所需的文档信息。为企业搭建了一个横跨所有工作内容、所有团队和真相的统一搜索参考平台。这个搜索平台能够对接各种数据源,并且实现文档内容级别的索引,目前所支持的数据源包括:OneDrive、SharePoint、ServiceNow、Box、Dropbox、Github、Github Enter
原创
2021-03-11 10:37:59
749阅读
随着信息技术的飞速发展,搜索引擎作为信息获取的重要工具,扮演着不可或缺的角色。阿里云 AI 搜索开放平台以其强大的技术支持和灵活的开放性,持续为用户提供高效的搜索解决方案。
云盘服务走进我们的生活,我们所熟悉的还要是百度云盘近年来各大云盘也纷纷最赶潮流推出自己的品牌云盘,今天要给大家详细介绍的就是电信推出的天翼企业云盘,许多小伙伴儿们对于天翼企业云盘如何收费表示疑惑,下面就让我们一起来看看吧。一、什么是天翼企业云盘?天翼企业云盘是中国电信集团旗下的企业级云存储服务商品,专业为企业和精英团队给予安全性平稳的文档存储共享资源,企业文档办公协同等服务,专注于提升企业文档管理
转载
2023-11-09 17:16:27
49阅读
近几年关注的领域一直是企业级应用开发平台,不管是使用别人的平台,还是自己组织研发平台,所涉及到的技术和领域方法都差不多,希望在这方面和大家多做些交流。
说起用友的平台,UAP大家应该都知道,事实上用友集团还有一个平台,那就是用友软件工程公司的GAP平台,与UAP宏大的产品架构和产品研发思
路不同的是,GAP平台更多的关注点是个性化IT服务,GAP更多是作为一种框架、工具和基础设施来为客
转载
2023-12-17 16:01:58
39阅读
传统企业该如何走向平台化,这里所说的平台化,不是上几个软件就能够解决的,平台化是指通过“去中介化”“去中间化”,让产销、供需的双方依托平台的服务生态系统直接对接,简化价值链流程,实现数据共享与信息透明,改变传统行业依靠买卖赚差价的盈利方式以及上下游博弈的恶性竞争关系。平台化企业的核心是“以用户为中心”,以数据驱动和生态协同的方式重新构建商业模式、供应链和价值链。商业模式的创新激发了新的产品和新的需
转载
2023-07-31 19:14:22
88阅读
也许,这几年过多的目光关注于互联网搜索,Google,Baidu市值的高涨,让人们对它们倍加关注。其实,搜索,不光是面向公众的互联网搜索。还有专注于企业内的非结构化数据搜索,它同样会面临着海量数据处理的技术问题,还有着其它方面更苛刻的要求,尤其是安全性,面对不同的用户,搜索到的内容是有区别的,甚至涉及到法律问题。而互联网搜索在这方面,几乎没有什么限制。泛企业搜索平台能够在全球性的企业机构中实现跨部门、多操作系统、多语言、多文件类型的自动信息检索、处理和管理。实际的泛企业搜索需求:能够访问所有数据源和文件类型:现今,企业内部80%的信息是非结构化的,由文字、音频和视频组成。而这类信息需要进行适当
转载
2009-03-01 20:42:00
101阅读
2评论
背景随着公司业务的高速发展以及数据爆炸式的增长,当前公司各产线都有关于搜索方面的需求,但是以前的搜索服务系统由于架构与业务上的设计,不能很好的满足各个业务线的期望,主要体现下面三个问题:不能支持对语句级别的搜索,大量业务相关的属性根本无法实现没有任何搜索相关的指标评价体系扩展性与维护性特别差基于现状,对行业内的搜索服务做出充分调研,确认使用ElasticSearch做底层索引存储,同时重新设计现有
推荐
原创
2017-12-10 19:49:57
10000+阅读
点赞
5评论