ES数据库的数据以什么形式存储在操作系统 es数据库使用场景

转载

mob6454cc6328d1 2024-03-07 09:17:05

文章标签 elastic 应用场景 elastic数据同步 canal bulk API 文章分类 架构后端开发

【前提】

目前公司订单数据库虽然使用了索引、缓存、读写分离等，由于业务本身复杂以及数据量的不断上涨，导致查询出现了瓶颈，海量数据查询对于APP有时候甚至出现超时现象，不得不对这种情况做出处理。其中可行解决方案比如：分库分表、使用ElasticSearch检索、优化索引等，最终组内评定，选择了通过ElasticSearch来解决这个问题。

【设计思想】

ES数据库的数据以什么形式存储在操作系统 es数据库使用场景_elastic

如图所示，类似数据库的读写分离，增删改操作直接操作数据库，查询操作，利用ES快速检索的能力，直接从ElasticSearch中通过DSL语句进行查询。

针对于这种情况，我们不需要重构系统，只需要将ES查询这部分设计成组件，插入到原有的系统当中。其中我们的设计是这样的：

1.单独为ES查询新建了项目，通过RPC的形式，来请求查询；

2.在系统Service层统一通过配置中心设计一组“开关”，防止elasticsearch崩溃时，紧急将底层查询切换回Mysql数据库。

【数据同步】

由上可知，基本的思想是读写分离到ES，解决慢查询问题，那么mysql的数据是如何同步到elasticsearch中呢？

binlog + cancel + blukAPI(ElasticSearch)

从Mysql实时同步到ES，我采取了上述技术栈组合的方案。当然，对于es官方给出的同步策略以及开源出来的同步策略主要包含： 1.elasticsearch-jdbc | https://github.com/jprante/elasticsearch-jdbc 2.elasticsearch-river-MySQL | https://github.com/scharron/elasticsearch-|river-mysql 3.go-mysql-elasticsearch https://github.com/siddontang/go-mysql-|elasticsearch （国内） 4.logstash-input-jdbc https://github.com/logstash-plugins/logstash-|input-jdbc （Addition：每种插件的github地址，已列出）

如上所述的这4种方案，都可以实时地将Mysql数据同步到ES中，在“铭毅天下”大神的博客中，看到了这4种插件优劣性的对比：

ES数据库的数据以什么形式存储在操作系统 es数据库使用场景_bulk API_02