es UpdateAction 批量更新部分java es批量更新数据失败

转载

jimoshalengzhou 2023-10-17 12:28:45

文章标签 redis 服务器 redis缓存 文章分类 Java 后端开发

需求分析
实施阶段
出现问题
新的解决办法
后记

有一年多的下载日志准备一次性的导入到es，虽然通过redis削峰，但是出问题后发现日志信息都堆积在redis缓存里，logstash的indxer处理不过来就导致记日志挂了。

需求分析

现在es服务器里已经有了vsftpd和pureftpd的下载日志，用的不同的索引，所以相互不干扰。但是现在要统计下载量的话需要分别统计不同的索引，所以就需要把它们俩的索引设置成一样的，删除es里pureftpd的所有数据，再重新导入日志到vsftpd的索引里面。

实施阶段

切换到logstash文件目录
# cd /home/logstash/logstash-1.5.3/etc
打开logstash配置文件将type改为和vsftpd的配置文件一样，重启logstash服务

出现问题

问题分析

就是这么简单的一个事，导致了其它服务器大概5个小时没有新的日志到es，然后开始排查问题，定位到logstash indxer出错，报的错是503；大致意思是输入的数据量太大导致它无法工作，输入的是redis，也就是说redis里面的数据量太大处理不过来导致的。

问题解决

没有其它的解决办法，只能放弃导入pureftpd的日志，把pureftpd的logstash停了。再去redis服务器将redis重新启动，这4个小时存的日志抛弃。

redis-server /etc/redis.conf

已经导入的部分pureftpd的日志是无用的，需要给删除掉

删除数据，不删索引
#curl -XDELETE 'http://192.168.201.145:9200/logstash-vsftp_log-2017*/_query' -d #'{
#	"query" : {
#    "match" : { "ftpType" : "pure-ftpd" }
#	}
#}'

如果里面有空索引还要删除对应的索引

重新启动pureftpd logstash，日志就不用从头开始刷了，只tail的方式存入新日志。

新的解决办法

日志没有导入进去我是不甘心的，但是又不能一次性给批量刷到redis缓存中，不然又会挂掉，也不能不通过缓存直接往es刷，生产环境也不敢随便尝试。所以折中的解决办法，往redis缓存的刷慢点就可以把这个解决了。解决思路是写一个shell脚本把日志文件从头开始每秒刷10-20行到新的文件中，logstash的input设置为新的文件，这样就可以达到慢点刷的效果。

新建一个shell脚本

#!/bin/bash
	
	cd /home/logstash/logstash-1.5.3/pure_solve #切换目录
	
	toltalCount=`cat pureftpd.log |wc -l` #统计日志有多少行
	
	startLine=1	#从开头开始刷
	
	while (($startLine < $toltalCount))		#循环刷
	do
	        endLine=`expr $startLine + 20`	#步值为20
	        sed -n "$startLine,$endLine p" pureftpd.log >> pureftpd_new.log  #开始写
	        startLine=$endLine		#移动步子
	        echo $startLine > sincedb	#记录刷到什么地方了
	done

将logstash shipper的input path设置为新的 /home/logstash/logstash-1.5.3/pure_solve/pureftpd_new.log，启动logstash
执行脚本

后记

今天是年前上班的最后一天，刷了一篇博客，下班后就准备准备回家了，哦耶！

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：java没有可利用的缓冲区空间 java中不存在内存泄漏

下一篇：前后端分离的企业级微服务架构前后端分离与微服务

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯