文章目录前言一、安装elasticsearch-analysis-pinyin分词器1.下载解压打包2.解压到elasticsearch plugins 插件目录下3.重启es查看分词器是否生效二、kibana配置analysis-pinyin插件1.测试analysis-pinyin是否生效1.新建索引1.1查看 [README.md](https://github.com/medcl/ela
转载
2024-07-22 19:32:06
387阅读
最近有个项目需要用到拼音搜索并高亮显示所匹配的中文,其实拼音搜索可以通过将中文转化为拼音存储在库表如mysql中,然后通过sql like语句查询搜索到对应的中文,在一些并发要求并不高、中文已知的情况下是完全可以做到拼音搜索。但是由于项目要求不仅能够搜索出来对应的中文,但是对于高亮显示匹配的中文难度成本就比较高了,此时需要通过中文拼音分词来实现。 经过一番调研,鉴于elasticsearch社区的
转载
2024-02-19 18:00:22
649阅读
目录 什么是ESES的特点 ES下载ES的安装ES的管理工具Kibana5ES 的使用文档ES的查询与过滤什么是ES **ES** 全称 **ElasticSearch** 是一种分布式全文搜索引擎,基于Lucene(全文搜索框架)开发而来。 Lucene是公认的迄今为止的最好用的搜索引擎库,但是他所提供的API对于我们使用者来说,是非常苦恼的,常要花
转载
2024-07-08 20:37:11
36阅读
1.下载并解压elasticsearch官网 http://www.elastic.co/downloads/elasticsearch本次下载地址 https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.2.3.tar.gz 解压 tar -zxvf elasticsearch-6
一、插件简介elasticsearch-analysis-lc-pinyin是一款elasticsearch拼音分词插件,可以支持按照全拼、首字母,中文混合搜索。首先举个栗子说明下,我们在淘宝搜索框中输入“jianpan” 可以搜索到关键字包含“键盘”的商品。不仅仅输入全拼,有时候我们输入首字母、拼音和首字母、中文和首字母的混合输入,比如:“键pan”、“j盘”、“jianp”、“jpan”、“j
转载
2024-03-10 08:50:22
1765阅读
suggest,completion suggest,自动完成,搜索推荐,搜索提示 --> 自动完成,auto completion auto completion 比如说我们在百度,搜索,你现在搜索“大话西游” -->百度,自动给你提示,“大话西游电影”,“大话西游小说”, “大话西游手游” 不用你把所有你想要输入的文本都输入完,搜索引擎会自
转载
2024-03-18 20:24:09
109阅读
1.应用场景主要用于学习ES的模糊搜索,应用场景,效率以及底层实现。2.学习/操作2.整理输出TBD后续补充...3.问题/补充1. 实现需求:substring方式,从前往后开始匹配如输入abc输出结果abc, abca, abcac, abcb, abcc ... xabcxxaabc, babc, ... xabc, xabc......xxxxxabcxxxx提示:使用dis_max +
Vue项目中 实现ElementUi框架el-select拼音搜索功能拼音搜索功能注意事项 拼音搜索功能前言:由于项目需要,且elementUI中的el-select只支持中文或英文匹配,不支持全拼音匹配或拼音首字母匹配,故封装该功能。代码依赖 第三方包:pinyin-match 地址: https://github.com/xmflswood/pinyin-match代码支持:全拼音匹配 当输
转载
2024-07-31 07:09:50
38阅读
一、插件简介elasticsearch-analysis-lc-pinyin是一款elasticsearch拼音分词插件,可以支持按照全拼、首字母,中文混合搜索。首先举个栗子说明下,我们在淘宝搜索框中输入“jianpan” 可以搜索到关键字包含“键盘”的商品。不仅仅输入全拼,有时候我们输入首字母、拼音和首字母、中文和首字母的混合输入,比如:“键pan”、“j盘”、“jianp”、“jpan”、“j
转载
2024-06-19 10:22:48
154阅读
#职场excel小技巧#我们知道,汉字排序最常见的是拼音排序,拼音排序在Excel中是默认的汉字排序方式。但是,如果要对汉字按部首排序呢?Excel中要如何操作?01Excel中对汉字默认的排序是拼音顺序在Excel中,对汉字的默认排序方式是按拼音排序:所以不借助PowerQuery,是无法实现对汉字的按部首排序的。02PowerQuery对汉字的默认排序规则是按部首排序PowerQuery中对汉
转载
2024-10-28 10:47:37
48阅读
准备首先先声明下,我这里使用的 ES 版本 5.2.0.为了便于理解,这里以如下 index 为格式,该格式是通过 PMACCT 抓取的 netflow 流量信息, 文中所涉及的到的例子,全基于此 index.本篇涉及的内容可以理解为 ES 的入门内容,主要针对词项的过滤,为基础篇。{
"_index": "shflows_agg_1600358400",
插件作为一种普遍使用的,用来增强原系统核心功能的机制,得到了广泛的使用,elasticsearch也不例外。1. 安装Elasticsearch插件从0.90.2安装其实很简单,有三种方式,1.1 在确保你网络顺畅的情况下,执行如下格式的命令即可:1plugin --install <org>/<user/component>/<version> 具体
拼音搜索在中文搜索环境中是经常使用的一种功能,用户只需要输入关键词的拼音全拼或者拼音首字母,搜索引擎就可以搜索出相关结果。在国内,中文输入法基本上都是基于汉语拼音的,这种在符合用户输入习惯的条件下缩短用户输入时间的功能是非常受欢迎的。  
转载
2024-04-22 17:07:02
407阅读
ElasticSearch6.5.4<一>单机部署以及简单尝试ElasticSearch6.5.4<二>几个重要概念以及常用搜索ElasticSearch6.5.4<三>中文以及拼音的操作ElasticSearch6.5.4<四>java使用ES并实战搜索ElasticSearch6.5.4<五>集群操作ElasticSearch6.5.
转载
2024-03-29 15:31:23
113阅读
1. 数据格式
Elasticsearch是面向文档型数据库,一条数据在这里就是一个文档。 为了方便理解,可以将 Elasticsearch里存储文档数据和关系型数据库MySQL存储数据的概念进行一个类比。
Elasticsearch里的 Index可以看做一个库,而 Types相当于表, Documents则相当于表的行。
但这里Type
转载
2024-03-18 00:06:12
160阅读
1,elasticsearch的安装1,es启动时需要使用非root用户,所有创建一个bigdata用户(如果是root用户安装的话,启动时会有提示 elastic could not run a root的报错):#创建用户useradd bigdata#为bigdata用户添加密码:passwd bigdata #创建一个bigdata目录mkdir /bigdata#给
一、简介有时候我们需要在项目中支持中文 和 拼音的搜索。采用ik分词来做中文分词是目前比好的方式。至于拼音分词可以采用lc-pinyin,虽然lc-pinyin能很好的解决首字母和全拼的搜索,但是在中文分词上却是不支持的,lc-pinyin只能把中文拆成单字来处理。要是能把IK分词和lc-pinyin分词结合那该多好,不是么?本文主要介绍如何把ik和lc-pinyin结合起来使用,使我们的搜索既支
转载
2024-09-09 07:58:38
54阅读
/**
* @author ChineseSpelling
* 所有全拼集合 汉字转拼音 使用工具类
*/
public class ChineseSpelling {
private static int[] pyvalue = new int[] { -20319, -20317, -20304, -20295,
-20292, -20283, -20265,
转载
2024-07-31 07:08:41
25阅读
之前我们讲了logstash的配置:增量配置、全量配置、多输入输出配置等,今天我们讲解一下logstash的俩个重要的组件:ik分词器与ik拼音分词器。为什么要有要装ik分词器是因为在一定意义上满足不了当前所需的业务。ik分词器-举个栗子: 在未用ik分词器之前,我们搜索 中人共国 会将中人共国 拆分为 中人共国 去进行搜索,当我们搜索的内容里存在中华 或者 人民这样的包含这俩个词组的内容时 就不
import java.util.Collections;
import java.util.Iterator;
import java.util.LinkedHashMap;
import java.util.Map;
/**
* 将汉字转化为全拼
*/
public class CnToSpell {
private static Map<String, Integer>
转载
2023-08-04 11:29:01
511阅读