elasticsearch 自定义ID: curl -s -XPUT localhost:9200/web -d ' { "mappings": { "blog": { "_id": { "path": "uuid" }, "properties": {
原创 2023-05-31 11:31:06
322阅读
elasticsearch 自定义打分
原创 2017-03-06 22:11:48
2372阅读
elasticsearch自定义排序
es
原创 2017-11-28 13:33:55
10000+阅读
11点赞
3评论
公司分库分表使用用户id,主键后3位拼接用户id后三位,现把相关分片规则自定义简易组件使用 一、参数配置 引用者可以配置主键字段与用户字段命名,配置分片日志记录等 package com.ypshengxian.shardingslice.properties; import org.springframework.beans.factory.annotation.Value; impo
原创 2023-08-10 12:22:52
658阅读
添加用户和角色 curl --insecure -u elastic:Transfar@2022 -XPOST 'https://192.168.30.149:9200/_security/user/esuer?pretty' -H 'Content-Type: application/json'
原创 2023-08-18 11:31:42
447阅读
ElasticSearch-索引优化-自定义索引
当一个 document 被索引时, 通常是对应每个 field 都生成一个倒排索引(Inverted Index)用于作为存储的数据结构, 关于倒排索引, 推荐炮哥之前写的一篇文章可以结合参考理解. 每个 field 的倒排索引是由「对应」于这个 field 的那些词语(term)所组成. 从而, 搜索的时候, 就可查到某个 document 是否含有(或者说命中)某些 terms, 进而返回所
转载 2018-09-06 15:20:31
3478阅读
1点赞
以“新冠病毒肺炎”为例,我想让分词器将新冠作为一个词,由于ik分词器本身的词库中未录入这个词,我们在前面也看到了,ik分词
原创 2023-10-16 16:54:53
94阅读
一、为什么我们需要自定义分词器 1.1 安装拼音分词器 要实现拼音分词检索,就必须对文档按照拼音分词。在 GitHub 上恰好有 elasticsearch 的拼音分词插件。 地址: https://github.com/medcl/elasticsearch-analysis-pinyin 把yinpin分词器拷贝到es的/plugins目录里面重启es的容器: docke
Elasticsearch 实战项目中势必会用到中文分词,而中文分词器的选型包含但不限于如下开源分词器
原创 2022-10-19 08:24:36
227阅读
Elasticsearch 如何自定义扩展词库?
原创 2022-05-12 20:11:49
376阅读
自定义分词器
原创 2023-04-12 02:17:50
80阅读
真实开发中我们往往需要对一段内容既进行文字分词,又进行拼音分词,此时我们需
原创 2022-07-02 00:03:09
247阅读
一、简单描述自定义数字范围分片,故名思议,就是要自己定义数字的范围来规划每个分片的区域,这就要求我们提前规划好分片字段某个范围属于哪个分片,比如说将第一个500W的数据分片在第一个节点上面,第二个500W的数据分片在第二个节点上,依次类推。二、实施自定义数字范围分片1、配置rule.xml在rule.xml中添加如下配置: id rang-long-custom
原创 2022-04-22 13:28:10
131阅读
经过 ShardingSphere分库分表查询 当中所介绍的 range 查询发现是报错的是不支持的,所以在本文当中主要就是介绍该问题的解决方案,就是自定义分片算法实现 range 查询,首先修改 application.properties 修改 db 与 table 的策略为我们自定义的策略如下
原创 2021-12-13 14:58:00
982阅读
Java SPI机制在上一篇博客中介绍了ElasticJob的作业分片策略:ElasticJob‐Lite:作业分片策略介绍与源码分析其中提到了ElasticJob是通过Java
原创 2022-11-09 18:50:49
161阅读
一、简单描述自定义数字范围分片,故名思议,就是要自己定义数字的范围来规划每个分片的区域,这就要求我们提前规划好分片字段某个范围属于哪个分片,比如说将第一个500W的数据分片在第一个节点上面,第二个500W的数据分片在第二个节点上,依次类推。二、实施自定义数字范围分片1、配置rule.xml在rule.xml中添加如下配置: id rang-long-custom
原创 2017-08-09 20:56:05
157阅读
默认情况下,logstash是没有配置中文分词的, 那要如何解决呢? 解放方法: 自定义模板配置中文分词 自定义模板中增加分词器 1、创建自定义模板 完整的模板内容 logstash-ik.json { "order": 0, "version": 1, "index_patterns": ["*"
转载 2021-01-12 18:01:00
545阅读
2评论
自定义的分析器。一个分析器就是在一个包里面组合了三种函数的一个包装器, 三种函数按照顺序被执行: 字符过滤器 字符过滤器 用来整理一个尚未被分词的字符串。例如,如果我们的文本是HTML格...
原创 2022-11-21 08:46:00
192阅读
1.简介当自带的分词器无法满足需求时,就可以通过自定义分词来解决,自定义分词器的组成包括character filters、tokenizer和token filters三个部分。2.Character Filters(1).简
原创 2022-10-24 17:50:44
100阅读
  • 1
  • 2
  • 3
  • 4
  • 5