【现象】:EJF调用PLM的接口,短时间内出现大量下单请求,导致网络阻塞,数据库连接池达到上限,接口崩溃; 【环境】:服务器使用的是阿里云,centos7 + docker + redis + netcore,网络带宽5M,数据库最大连接数设置了3000; 【分析】:接口出现崩溃现象后—— 1、检查
转载 2019-10-25 16:02:00
85阅读
2评论
# MySQL生产事故 在大规模的软件开发和运维项目中,MySQL数据库是常用的关系型数据库管理系统。然而,由于人为失误、硬件故障、网络问题等原因,MySQL生产环境中的事故时有发生。本文将介绍一些常见的MySQL生产事故,以及如何预防和解决这些问题。 ## 常见的MySQL生产事故 ### 1. 数据库性能问题 当用户量增大或者业务逻辑复杂时,数据库性能问题可能会导致响应时间延长、系统崩
原创 2023-08-16 09:37:58
59阅读
一次高并发抢购活动引起的生产事故的过程分析记录 1.在日志中观察到的很多dubbo超时报错 Caused by: com.alibaba.dubbo.remoting.
原创 2022-07-28 11:42:06
147阅读
mysql的事件需要使用事件调度器对事件进行操作,安排执行用户设置的事件 事件调度器:可以定时激活多个数据库操作,事件就是一个与计划相关联的存储程序,计划会定义事件执行的时间和次数,并且 定义事件何时强行退出(如处理无人值守的系统管理任务,报告定期更新,旧数据过期清理,日志表轮换等操作) 1.首先要启动事件调度器: 在mysql安装目录下的my.ini文件里面加入下面的语句
转载 2023-07-07 22:37:34
55阅读
事故一,jvm相关大对象(运营商数据;数据库查询未加查询条件,结果集过大;
原创 2023-03-01 16:54:30
77阅读
下面这个文章是我看到的,确实是挺有意思的,大家对生产环境的可怕还没太多意识,转给大家看看。这下面的几点,我犯过第一条和第二条相结合的错误:我们当时在客户现场工作,上线之后为了能方便看到生产的数据以找出问题,所以我们的pl/sql都是既能连到测试库,也能连到生产库的,有一次,我删除测试库的数据delete from tableA,我意识到可能会和生产搞混,特意看了下,这个窗口连的是测试库,那个窗口连
背景分析解决方案参考
原创 2022-10-28 14:25:45
151阅读
【背景介绍】写出该事故发生的场景,步骤,线上,事故等级以及谁发现的问题等相关背景【发生时间】写出该事故首次发生或爆出的具体时间,精确到分钟或秒钟【问题版本】是哪一个版本,比如 SDK 1.3.4 版本【事故影响】该事故对哪些业务产生了影响,是否影响了客户以及可能造成的损失等【事故原因追踪】详细说明造成事故的整理过程。这里就比较详细的说明,事故主要责任人再造成该事故前,都做了什么,以及沟通了什么,才
近期,公司系统内相继发生2起110kV线路跳闸,造成多个110kV变电站失压的电力生产安全事件,目前事件正在深入调查分析。为确保公司2019年各项安全生产工作开好头、起好步,各单位要充分汲取事件教训,全面落实各项风险管控措施。现将2起事件简要情况通报如下: 一、“1·4”普洱供电局110kV城洗线跳闸造成4个110kV变电站失压事件(一)事件简况 根据2018年度红河供电局技改大修工作计划,201
前言Insert into select请慎用。这天xxx接到一个需求,需要将表A的数据迁移到表B中去做一个备份。本想通过程序先查询查出来然后批量插入。但xxx觉得这样有点慢,需要耗费大量的网络I/O,决定采取别的方法进行实现。通过在Baidu的海洋里遨游,他发现了可以使用insert into select实现,这样就可以避免使用网络I/O,直接使用SQL依靠数据库I/O完成,这样简直不要太棒了
转载 2021-04-14 15:43:20
127阅读
近期遭遇了一次生产环境的严重告警,涉及慢接口和CPU过载。经过排查,发现问题根源在于一段使用MyBatis的查询代码。当传入空列表作为查询条件时,MyBatis会忽略该条件,导致全表扫描,进而引发系统资源耗尽和频繁的Full GC
推荐 原创 7月前
889阅读
本次问题主要是后端返回的订单编号是Long类型,在特定数值下会造成和前端拿到的orderId不一致,通过orderId再去更新时导致页面上
原创 精选 10月前
319阅读
1点赞
前言这是帅丙真实事件,大家都知道很多公司都是有故障等级这么一说的,这就是敖丙在公司背的P0级故障,敖丙差点因此被解雇,事情经过十分惊心动魄,我的心脏病都差点复发。事故等级主要针对生产环境,划分依据类似于bug等级。P0属于最高级别事故,比如崩溃,页面无法访问,主流程不通,主功能未实现,或者在影响面上影响很大(即使bug本身不严重)。P1事故属于高级别事故,一般属于主功能上的分支,支线流程,核心次功
前言  Insert into select请慎用。这天xxx接到一个需求,需要将表A的数据迁移到表B中去做一个备份。本想通过程序先查询查出来然后批量插入。但xxx觉得这样有点慢,需要耗费大量的网络I/O,决定采取别的方法进行实现。通过在Baidu的海洋里遨游,他发现了可以使用insert into select实现,这样就可以避免使用网络I/O,直接使用SQL依靠数据库I/O完成,这样简直不要太棒了。然后他就被开除了。事故发生的经过。  由于数据数据库中order_today数据量过大,当时好
转载 2021-07-28 16:57:52
296阅读
文章目录事故一,jvm频繁full gc事故二:内存泄露事故三:幂等问题事
原创 2023-03-01 16:54:39
67阅读
Insert into select请慎用。
原创 2021-06-04 18:53:02
287阅读
Redis事件Redis的ae(Redis用的事件模型库) ae.cRedis服务器是一个事件驱动程序,服务器需要处理以下两类事件:文件事件(file event):Redis服务器通过套接字与客户端(或者其他Redis服务器)进行连接,而文件事件就是服务器对套接字操作的抽象。时间事件(time event):Redis服务器中的一些操作(比如serverCron函数)需要在给定的时间点执行,而时
前言: 突然发现自己公司买的本地测试服务居然被黑客入侵拿来挖矿了,这能忍吗? 1:查看服务 2:查看定时任务 检查开机启动项 cd /etc/init.d/ cat /etc/rc.d/rc.local 查看启动时间:ps -p 5952 -o lstart 查看脚本位置 crontab -r #删
原创 2022-06-06 01:52:49
373阅读
怎么样?标题够吸引人的吧,想了解内情请往下面看。前几日和一位MySQL的OracleACE聊天,谈到了一个所谓的“段子”。既然说到了OracleACE那我就先介绍一下ACE计划吧,想到哪儿写哪儿。OracleACE计划的目的是认可和奖励Oracle技术成员和应用社区所作的贡献。这些人在技术上精通,并愿意通过演示、博客、社交媒体文章,社区论坛支持等分享他们的知识和经验。OracleACE分为3个级别
原创 2021-02-28 22:24:23
319阅读
  在一个项目中,需要轻量级用到脚本语言,来提高应用服务的灵活性。因为知道Roslyn可以动态编辑C#,本着情怀,就自然用Roslyn来处理这块业务了。开在windows上执行,一次调用风平浪静,因为这个功能使用频次不高,性能也没有太在意,上线后一切安好。事情发生在n天后,随着数据的增多,批量的数据上来了,批量使用这个功能时,把pod(我们的环境是kubernetes)使用爆炸了,只要用这个功能的
转载 2022-02-01 16:05:34
108阅读
  • 1
  • 2
  • 3
  • 4
  • 5