es写入中备份索引 es数据备份到hadoop

关注 mob64ca1416f1ef

es写入中备份索引 es数据备份到hadoop

转载

mob64ca1416f1ef 2024-04-05 12:46:49

文章标签 es写入中备份索引大数据 php java Elastic 文章分类 架构后端开发

早先时候我们讲了关于HDFS的备份方法，作为Hadoop在搜索层级的演进应用，Elasticsearch可以接入多种异构的数据平台(结构化/非结构化，流式/批量的)，加之有丰富的管理工具，在很短时间内迅速获得了很多有EDW需求的公司的青睐。

es写入中备份索引 es数据备份到hadoop_大数据

在Elasticsearch的架构中，由Logstash负责采集客户端数据（类似于Hadoop生态系统中的Flume，当然Flume和Hadoop也可以直接作为Elasticsearch的数据源），再由Elasticsearch做即时分析与处理，最后交由基于现代化HTML5的web应用-Kibana将分析结果作可视化展现。

es写入中备份索引 es数据备份到hadoop_Elastic_02

说到Elasticsearch的用户，刚被微软以75亿美元天价收购的Github就是一个典型案例，此外还有Facebook、WordPress、stackoverflow等超大型社交类应用及社区。Elasticsearch不仅给这些用户提供了冗余、可扩展的数据系统，并且通过实时索引，有效地将原先长达几十分钟的搜索体验缩短至秒级。通过轻型的Elasticsearch-Hadoop库可以与现有的Hadoop平台无缝对接，并且可以实现数据的双向传输。

es写入中备份索引 es数据备份到hadoop_php_03

Elasticsearch的安装也很方便，我们知道在Mac系统上brew是用来安装程序的指令，在安装完Java（运行“brew cask install java”指令）之后，通过brew install <路径>/<安装文件>即可完成对Elasticsearch的安装；装完之后通过brew info elasticsearch可以检查版本及配置信息。

es写入中备份索引 es数据备份到hadoop_php_04

既然要备份Elasticsearch，我们先来创建一些数据，比如在索引nameindex的组names下的数据名id1下创建以下数据：

curl -XPOST 'localhost:9200/nameindex/names/id1' -d '

{

"name":"Johnnie"

"email_address":"johnnie.li@eoitek.com"

}

当然Elasticsearch有自己的管理接口可以通过Web界面操作，只需填入数据路径和数据内容即可。

es写入中备份索引 es数据备份到hadoop_Elastic_05

填完之后通过GET语句可以查询（命令行：curl -XGET）

es写入中备份索引 es数据备份到hadoop_Elastic_06

这条记录是建立在数据集id1下的，我们也可以建立没有ID的记录。

es写入中备份索引 es数据备份到hadoop_es写入中备份索引_07

这个时候系统会自动为其创建ID。

es写入中备份索引 es数据备份到hadoop_es写入中备份索引_08

在每个Elasticsearch的配置文件（/config/elasticsearch.yml）中都有定义repository的路径。

es写入中备份索引 es数据备份到hadoop_java_09

Elasticsearch的备份方式与Hadoop类似，也是采用快照（Snapshot）形式，你可以单独为某个索引、多个索引或整个集群做快照。鉴于我们刚刚在索引nameindex下面创建了些记录，那我们就来备份这条索引，第一步先决定备份参数：

es写入中备份索引 es数据备份到hadoop_Elastic_10

用GET方式检查下备份配置是否创建完成。

es写入中备份索引 es数据备份到hadoop_Elastic_11

以上是ES备份的逻辑路径，根据elasticsearch.yml里的设置，我们已经在path.repo的路径下创建了同名的物理目录。

es写入中备份索引 es数据备份到hadoop_Elastic_12

接下去就是执行备份，同样使用PUT方式

es写入中备份索引 es数据备份到hadoop_es写入中备份索引_13

备份完成之后，在逻辑路径下会记录备份的状态。可以用curl localhost:9200/_snapshot/nameindexbackup/10jul2018查看。同时，我们在物理路径下也看到了元数据及快照文件已经生成。

es写入中备份索引 es数据备份到hadoop_java_14

在数据恢复之前，我们先把nameindex下的数据都删除。

es写入中备份索引 es数据备份到hadoop_java_14

检查发现目标逻辑路径下已经没有任何数据了。

es写入中备份索引 es数据备份到hadoop_大数据_16

恢复的命令是curl -XPOST localhost:9200/_snapshot/nameindexbackup/10jul2018/_restore。检查后发现我们的数据已经恢复了。

es写入中备份索引 es数据备份到hadoop_java_17

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：kubesphere 解压报错 kubernetes apiversion

下一篇：mybatisplus 增删改查demo 用mybatis框架进行增删改查

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册