文档, 在结构上说,类似与关系型数据库的一条数据。 这怎么是文档呢?我写的一篇文档,存成一个doc文件,这是一个文档吧? 里面有很多条数据啊,文档好像是表的概念! 从起源上来看,大数据要去搜索东西,就是一个个网页,每个网页算一个文档,文档里的词是字段。 而数据库里,存的只是这些文档的倒排索引,这也是 ...            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2021-09-04 08:40:00
                            
                                945阅读
                            
                                                                                    
                                2评论
                            
                                                 
                 
                
                             
         
            
            
            
            1. 添加文档POST /website/blog/{ "name":"zhangsan", "age":14} 其中 blog 是type,就是未来版本要废弃的 那个弱化他,用下面的POST /ppp/_doc{ "name":"zhangsan", "age":14} 2.用这个新增type 会 ...            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2021-09-13 19:02:00
                            
                                900阅读
                            
                                                                                    
                                2评论
                            
                                                 
                 
                
                             
         
            
            
            
            1 Search API简介实现对 ES 中存储的数据进行查询,endpoint 为 _search//查询全部GET /_search // 指定单个索引查询GET /my_index/_search // 指定多个索引查询GET /my_index1,my_index2/_search // 通配符查询GET /my_*/_search 查询形式URI Search方便通过命令行测试,仅能包含 es 提供的部分查询语法。GET /my_index/_search?q=u            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-07-09 10:30:30
                            
                                465阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            1 Search API简介实现对 ES 中存储的数据进行查询,endpoint 为 _search//查询全部GET /_s            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-03-14 14:42:16
                            
                                523阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            1、下载ealastic search和kibanadocker pull elasticsearch:7.6.2docker pull kibana:7.6.22、在虚拟机上创建目录mkdir -p /mydata/elasticsearch/config  创建目录mkdir -p /mydata/elasticsearch/dataecho "http.host: 0.0.0.0" >            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-03-06 09:29:27
                            
                                83阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            ElasticSearch的聚合(Aggregations)引入了两个概念: 
桶(Buckets):    满足特定条件的文档的集合
指标(Metrics):    对桶内的文档进行统计计算
每个聚合都是多个桶和指标的组合。和sql的聚合语法对比:
SELECT COUNT(color) FROM table_xxx GROUP BY color 
桶在概念上类似于 SQL 的分组            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2020-03-14 21:00:00
                            
                                329阅读
                            
                                                                                    
                                2评论
                            
                                                 
                 
                
                             
         
            
            
            
            Elastic Search 原理剖析
搜索引擎
ES            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2020-08-20 18:23:00
                            
                                96阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            其实Rest High Level Client的使用逻辑一共就分散步:拼json创建requestclient执行request创建client:RestHighLevelClient restHighLevelClient = new RestHighLevelClient(RestClient.builder(new HttpHost("127.0.0.1",9200,"http")));
            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-02-07 22:04:48
                            
                                60阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            1. 安装jdkjdk1.8 windows + Linux链接: https://pan.baidu.com/s/1uFAUbBthJ2H5Lrp1B6rGFg 提取码: 7vyp 复制这段内容后打开百度网盘手机App,操作更方便哦设置环境变量JAVA_HOME="D:\Java\jdk1.8.0_211"JAVA_BIN=%JAVA_HOME%\binCLASSPATH=...            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-08-13 10:05:24
                            
                                760阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            Elasticsearch是一个开源的分布式搜索和分析引擎,广泛应用于全文搜索、日志分析和数据可视化等领域。它基于Apache Lucene的倒排索引技术,能够快速地处理大规模数据,并支持实时的搜索和聚合操作。在使用Elasticsearch时,有时我们可能会遇到"put no response"这样的错误提示。本文将介绍这个错误的原因、解决方法以及相关的代码示例。
## 什么是"put no             
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-01-15 21:40:26
                            
                                129阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            画像项目介绍项目分类数据仓库离线数仓面向数据分析、报表服务分层管理、维度建模Hive实现用户画像构建在数据仓库之上toCtoB推荐系统用户画像之上淘宝等电商平台抖音 快手等内容平台广告社交Lambda架构离线+实时batch layer 批处理层speed layer 速度层service layer 服务层kappa架构-流批一体What用户画像 就是给用户打上海量的标签, 根据用户的目标, 行            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-07-29 21:07:25
                            
                                51阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1. 下载Elastic Search安装包 慢 ES官网下载地址:https://www.elastic.co/cn/downloads/past-releases#elasticsearch 快 华为镜像站下载地址:https://repo.huaweicloud.com/elasticsear ...            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2021-08-18 18:00:00
                            
                                449阅读
                            
                                                                                    
                                2评论
                            
                                                 
                 
                
                             
         
            
            
            
            分析是将文本,如任何电子邮件的正文转换成附加到反向索引的tokens(标记)或terms(条件)的过程。分析由分析器执行,它可以是内置的分析器,也可以是每个索引定义的自定义分析器。
索引时分析 
在索引时,内置的english analyzer(英文分析器)将会转换这个句子:
"The QUICK brown foxes jumped over the lazy dog!"
这些条件将被添加到反向            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2020-05-23 23:57:00
                            
                                537阅读
                            
                                                                                    
                                2评论
                            
                                                 
                 
                
                             
         
            
            
            
            倒排索引全文搜索引擎目前主流的索引技术就是倒排索引的方式。传统的            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-05-30 00:51:36
                            
                                242阅读
                            
                                                        
                                点赞
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            目标 部署一个单节点的ElasticSearch集群 依赖 java环境 安装 下载、解压 配置 config/elasticsearch.yml 参数含义 cluster.name 用来指定集群的名称。如果不指定,则默认是 elasticsearch。 node.name 用来指定当前节点的名称,
                    
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-08-21 00:16:16
                            
                                115阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            ELASTICSEARCH 性能调优建议 创建索引调优 1.在创建索引的使用使用批量的方式导入到ES。 2.使用多线程的方式导入数据库。 3.增加默认刷新时间。 默认的刷新时间是1秒钟,这样会产生太多小的SEGMENT,导致未来的合并压力,如果调整这个大小,会导致实时性的降低。 默认1秒钟,就是创建            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-07-22 15:44:03
                            
                                346阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            1. 下载Elastic Search安装包 慢 ES官网下载地址:https://www.elastic.co/cn/downloads/past-releases#elasticsearch 快 华为镜像站下载地址:https://repo.huaweicloud.com/elasticsear ...            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2021-08-18 18:00:00
                            
                                234阅读
                            
                                                                                    
                                2评论