安装ElasticSearch -> 参考官方文档,下载压缩包解压即可使用ElasticSearch head → 相当于一个可视化工具,用来查看数据 -> 可以直接安装浏览器插件kibana (查询工具) -> 参考官方文档,下载压缩包解压即可使用ik 分词器(中文分词器) → GitHub 下载后直接下载放入 plugins 目录 → 在config目录下可以配置自己的词典核
通过该图, 记住下面的几个定义: 集群(cluster):由一个或多个节点组成, 并通过集群名称与其他集群进行区分 es集群一般有几个master一个 “ • 一个正常es集群中只有一个主节点(Master),主节点负责管理整个集群。 节点(node):单个ElasticSearch实例. 通常一个节点运行在一个隔离的容器或虚拟机中 索引(index):在ES中, 索引是一组文档的集合 分片(sh
转载
2024-02-21 15:03:41
201阅读
一 分片概念以及设置分片概念:一个 分片 是一个底层的 工作单元 ,它仅保存了全部数据中的一部分。我们往 Elasticsearch 添加数据时需要用到索引 —— 保存相关数据的地方。索引实际上是指向一个或者多个物理 分片 的 逻辑命名空间。分片分为主分片和副本,数量可以设置。举个例子:假设elasticsearch集群由6台服务器,分别是 node-1、node-2、node-3、node-4、
转载
2024-03-16 15:43:54
212阅读
文章目录1、问题现象描述2、原因分析注意2.1 词频得分(TF)相关性2.2 反词频得分(IDF)相关性2.3 eplain 查看执行计划3、解决方案3.1 开发和灰度环境或数据量不大的情况3.2 对于生产环境4、测试数据 1、问题现象描述假设有shard_local_idf索引(索引数据见文章末尾)GET shard_local_idf/_search
{
"query": {
"
转载
2024-08-19 23:40:58
91阅读
在生产环境下,如果不修改elasticsearch节点的角色信息,在高数据量,高并发的场景下集群容易出现脑裂等问题。默认情况下,elasticsearch集群中每个节点都有成为主节点的资格,也都存储数据,还可以提供查询服务。这些功能是由两个属性控制的。node.master和node.data默认情况下这两个属性的值都是true。下面详细介绍一下这两个属性的含义以及不同组合可以达到的效果。node
转载
2024-08-04 15:33:57
55阅读
逆向索引:与传统的数据库不同,在es中,每个字段里面的每个单词都是可以被搜索的。如hobby:"dance,sing,swim,run",我们在搜索关键字swim时,所有包含swim的文档都会被匹配到,es的这个特性也叫做全文搜索。为了支持这个特性,es中会维护一个叫做“invertedindex”(也叫逆向索引)的表,表内包含了所有文档中出现的所有单词,同时记录了这个单词在哪个文档中出现过。例:
转载
2024-05-20 19:48:22
26阅读
概念索引ES将它的数据存储在一个或者多个索引中。用sql领域的术语来类比,索引就像数据库,可以向索引写入文档或者从索引中读取文档,并通过ES内部使用的Lucene将数据写入索引或从索引中检索数据。索引是具有某些类似特征的文档集合,索引由名称标识(必须全部小写)。分片ES会把查询文档集合分解为多个小的索引,每一个小的索引就叫做分片。每个分片都是一个独立的’索引’。 数据量非常大TB级别,数据分配到不
转载
2024-02-23 23:38:23
59阅读
搜索引擎是一个检索服务,主要分全文检索和垂直检索。ElasticSearch是分布式的索引库。一、es的名词定义关系型数据库 elasticsearchDatabaseIndexTableTypeRowDocumentColumnFieldSchemaMaping类型(type):es6.x只有一个type,之前可以建很多,es7.x就没有这个type了。二、分布式索引介绍1、numbe
转载
2024-03-18 15:28:22
305阅读
一、调整副本数如调整副本数为0curl -XPUT 'node3:9205/test_index/_settings' -d '{
"index": {
"number_of_replicas": "0"
}
}'返回{"acknowledged":true}二、调整索引分片索引分片数在索引创建好了之后就不能调整了,只能重建索引(ES 5.X 版本中有一个缩小分片的a
转载
2024-02-11 21:56:21
119阅读
elasticsearch可以通过reroute api来手动进行索引分片的分配。不过要想完全手动,必须先把cluster.routing.allocation.disable_allocation参数设置为true,禁止es进行自动索引分片分配,否则你从一节点把分片移到另外一个节点,那么另外一个节点的一个分片又会移到那个节点。数据量很少的时候,可能影响不大,但是如果数据量很大,这个参数必须要设置
转载
2024-07-19 07:42:24
253阅读
前阵子看了一下es文档中关于shards原理的介绍,于是按照自己的理解总结了一下,基本上是照着原文翻译的,个别部分是按照自己的理解写的。逆向索引/倒排索引:与传统的数据库不同,在es中,每个字段里面的每个单词都是可以被搜索的。如hobby:"dance,sing,swim,run",我们在搜索关键字swim时,所有包含swim的文档都会被匹配到,es的这个特性也叫做全文搜索。为了支持这个特性,es
转载
2024-06-22 20:13:49
71阅读
剪裁测试模板测试深度测试混合 片元着色器后续操作还包括剪裁测试、模板测试、深度测试、混合等,最终才会被送到帧缓冲区。剪裁测试剪裁测试可以在渲染时用来限制绘制区域,通过制定一个矩阵进一步限制帧缓冲区可以写入的像素,启用剪裁测试后,绘制不会在整个屏幕(帧缓冲区)进行,而是在指定的矩形区域进行。不在矩形区域中的片元被丢弃,在矩形区域内的片元才能被送往帧缓冲区,实际效果就是在屏幕上开辟了一个小窗
前言 前面我们学习过,master节点的职责有:负责决定当前某个分片要分配到哪个节点上面。 在节点间移动分片,保证集群的平衡。等等。 分片分配-基于集群配置 分片分配是指将分片分配到某个主机节点上的一个过程。触发的场景有:初始化恢复 分片副本分配 集群平衡 集群节点加入或者移除 分片的分配,对整个es集群有重要的影响,所以,如何熟悉控制它,是一个很重要的知识点。es集群提供设置集群
转载
2024-02-14 22:44:17
8阅读
谨慎分配你的分片当在ElasticSearch集群中配置好你的索引后, 你要明白在集群运行中你无法调整分片设置. 既便以后你发现需要调整分片数量, 你也只能新建创建并对数据进行重新索引(reindex)(虽然reindex会比较耗时, 但至少能保证你不会停机).主分片的配置与硬盘分区很类似, 在对一块空的硬盘空间进行分区时, 会要求用户先进行数据备份, 然后配置新的分区, 最后把数据写到新的分区上
转载
2024-04-24 16:00:51
0阅读
###1,es的命令GET _search
{
"query": {
"match_all": {}
}
}
#新增索引的同时添加分片,不使用默认分片,分片的数量
#一般以节点数平方计算,比如有3个节点,分片数量9个,3个主分片和6个副本
#设置分片和副本方式一,创建索引时就指定
PUT /testshards
{
"settings":{
"number
转载
2024-02-09 06:09:47
2281阅读
一个 shard 本质上就是一个 Lucene 索引,也是 Elasticsearch 分布式化 Lucene 的关键抽象,是 Elasticsearch 管理 Lucene 文件的最小单位。所以,Elasticsearch 提供了大量的接口,可以对集群内的 shard 进行管理。1 常用 shard 级 REST API 操作1.1 shard 移动将分片从一个节点移动到另一个节点,在使用 El
转载
2024-03-19 15:52:21
56阅读
Redis的分片(Sharding或者Partitioning)技术是指将数据分散到多个Redis实例中的方法,分片之后,每个redis拥有一部分原数据集的子集。在数据量非常大时,这种技术能够将数据量分散到若干主机的redis实例上,进而减轻单台redis实例的压力。分片技术能够以更易扩展的方式使用多台计算机的存储能力(这里主要指内存的存储能力)和计算能力:(1)从存储能力的角度,分片技术通过使
转载
2023-07-21 02:50:08
186阅读
分片重要性Es中所有数据均衡的存储在集群中各个节点的分片中,会影响ES的性能、安全和稳定性, 所以很有必要了解一下它。
分片是什么?简单来讲就是咱们在ES中所有数据的文件块,也是数据的最小单元块,整个ES集群的核心就是对所有分片的分布、索引、负载、路由等达到惊人的速度实列场景:假设 IndexA 有2个分片,我们向 IndexA 中插入10条数据 (10个文档),那么这10条数据会尽
转载
2024-03-15 14:28:02
156阅读
从故障说起某日早高峰收到 Elasticsearch 大量查询超时告警,不同于以往,查看 Elasticsearch 查询队列监控后发现,仅123节点存在大量查询请求堆积。各节点查询队列堆积情况查看节点监控发现,123节点的 IO 占用远高于其他节点。节点间IO占用对比最终查明原因是,某些高负载(高读写 qps、大数据量、复杂查询)的索引分片相对集中在123节点上,导致整体集群节点间负载不均衡,严
Elasticsearch的基础分布式架构Elasticsearch对复杂分布式机制的透明隐藏特性Elasticsearch是一套分布式系统,分布式是为了应对大数据量。Elasticsearch隐藏了复杂的分布式机制:分片:我们之前随随便便就将一些document插入到es集群中去了,我们没有关心过数据是如何进行分配的、数据到哪个shard中去了。集群发现机制(cluster discovery)
转载
2024-03-29 22:14:37
92阅读