es存储时序数据 es存储数据格式

转载

mob64ca140ce312 2024-02-29 23:02:43

文章标签 es存储时序数据 json 数据库数据结构与算法搜索 文章分类 架构后端开发

1.es的document数据格式和数据库的关系型数据格式的区别

1.1 es中document数据格式(ES主要是面向文档的搜索分析引擎)

      1.1.1 应用系统的数据结构都是面向对象的，复杂的
      1.1.2 对象数据存储到数据库中，只能拆解开来，变为扁平的多张表，每次查询的时候还得还原回对象格式，相当麻烦
      1.1.3 ES是面向文档的，文档中存储的数据结构，与面向对象的数据结构是一样的，基于这种文档数据结构，es可以提供复杂的索引，全文检索，分析聚合等功能
        1.1.4 es的document用json数据格式来表达

1.2 下面介绍es数据格式与mysql这样数据库的区别

1.2.1 下面是mysql两张关联表Employee，EmployeeInfo，并给一个对象赋值

public class Employee {
   private String email;
   private String firstName;
   private String lastName;
   private EmployeeInfo info;
   private Date joinDate;
 }
 private class EmployeeInfo {
   private String bio; // 性格
   private Integer age;
   private String[] interests; // 兴趣爱好
 }EmployeeInfo info = new EmployeeInfo();
 info.setBio("curious and modest");
 info.setAge(30);
 info.setInterests(new String[]{"bike", "climb"});Employee employee = new Employee();
 employee.setEmail("zhangsan@sina.com");
 employee.setFirstName("san");
 employee.setLastName("zhang");
 employee.setInfo(info);
 employee.setJoinDate(new Date());

1.2.2 下面是elaticSearch 的赋值格式，就是相当于一个json

{
     "email":      "zhangsan@sina.com",
     "first_name": "san",
     "last_name": "zhang",
     "info": {
         "bio":         "curious and modest",
         "age":         30,
         "interests": [ "bike", "climb" ]
     },
     "join_date": "2017/01/01"
 }

通过1.2.1和1.2.2我们就明白这两者上传数据的区别了。

2. 看下最简单的命令行

GET /_cat/health?v

es存储时序数据 es存储数据格式_json

epoch      timestamp cluster       status node.total node.data shards pri relo init unassign pending_tasks max_task_wait_time active_shards_percent
 1488006741 15:12:21  elasticsearch yellow          1         1      1   1    0    0        1             0                  -                 50.0%

如何快速了解集群的健康状况？green、yellow、red？

green：每个索引的primary shard和replica shard都是active状态的
yellow：每个索引的primary shard都是active状态的，但是部分replica shard不是active状态，处于不可用的状态
red：不是所有索引的primary shard都是active状态的，部分索引有数据丢失了

为什么现在会处于一个yellow状态？

我们现在就一个笔记本电脑，就启动了一个es进程，相当于就只有一个node。现在es中有一个index，就是kibana自己内置建立的index。由于默认的配置是给每个index分配5个primary shard和5个replica shard，而且primary shard和replica shard不能在同一台机器上（为了容错）。现在kibana自己建立的index是1个primary shard和1个replica shard。当前就一个node，所以只有1个primary shard被分配了和启动了，但是一个replica shard没有第二台机器去启动

3.创建索引

PUT /index/type/id
 {
   "json数据"
 }

index:为索引（相当于mysql的数据库）

type:为类型（相当于mysql的表）

id：为document（相当于 mysql的行）

es会自动建立index和type，不需要提前创建，而且es默认会对document每个field都建立倒排索引，让其可以被搜索

PUT 创建也可以覆盖

POST 修改

DELETE 删除

GET 查询

4. 查询

4.1 GET /ecommerce/product/_search

took：耗费了几毫秒

timed_out：是否超时，这里是没有

_shards：数据拆成了5个分片，所以对于搜索请求，会打到所有的primary shard（或者是它的某个replica shard也可以）

hits.total：查询结果的数量，3个document

hits.max_score：score的含义，就是document对于一个search的相关度的匹配分数，越相关，就越匹配，分数也高

hits.hits：包含了匹配搜索的document的详细数据

query string search的由来，因为search参数都是以http请求的query string来附带的

搜索商品名称中包含yagao的商品，而且按照售价降序排序：GET /ecommerce/product/_search?q=name:yagao&sort=price:desc

适用于临时的在命令行使用一些工具，比如curl，快速的发出请求，来检索想要的信息；但是如果查询请求很复杂，是很难去构建的
在生产环境中，几乎很少使用query string search

4.2 query DSL

DSL：Domain Specified Language，特定领域的语言

http request body：请求体，可以用json的格式来构建查询语法，比较方便，可以构建各种复杂的语法，比query string search肯定强大多了

查询所有的商品

GET /ecommerce/product/_search
 {
   "query": { "match_all": {} }
 } 
GET /ecommerce/product/_search
 {
     "query" : {
         "match" : {
             "name" : "yagao"
         }
     },
     "sort": [
         { "price": "desc" }
     ]
 } GET /ecommerce/product/_search
 {
   "query": { "match_all": {} },
   "from": 1,
   "size": 1
 }
  GET /ecommerce/product/_search
 {
   "query": { "match_all": {} },
   "_source": ["name", "price"]
 } 
       4.3 query filter
GET /ecommerce/product/_search
 {
     "query" : {
         "bool" : {
             "must" : {
                 "match" : {
                     "name" : "yagao" 
                 }
             },
             "filter" : {
                 "range" : {
                     "price" : { "gt" : 25 } 
                 }
             }
         }
     }
 }

4.3 full-text search（全文检索）

GET /ecommerce/product/_search
 {
     "query" : {
         "match" : {
             "producer" : "yagao producer"
         }
     }
 }

4.4 phrase search（短语搜索）

跟全文检索相对应，相反，全文检索会将输入的搜索串拆解开来，去倒排索引里面去一一匹配，只要能匹配上任意一个拆解后的单词，就可以作为结果返回
phrase search，要求输入的搜索串，必须在指定的字段文本中，完全包含一模一样的，才可以算匹配，才能作为结果返回

GET /ecommerce/product/_search
 {
     "query" : {
         "match_phrase" : {
             "producer" : "yagao producer"
         }
     }
 }

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：postgresql 存储过程终止循环 plsql存储过程打断点

下一篇：android 复制粘贴字符串安卓复制粘贴软件神器

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

es存储时序数据 es存储数据格式

es存储时序数据 es存储数据格式

51CTO博客