笔者很热衷于解决Bug,同时比较擅长(网络/协议)部分,所以经常被唤去解决一些网络IO方面的Bug。现在就挑一个案例出来,写出分析思路,以飨读者,希望读者在以后的工作中能够少踩点坑。前言 此Bug是Druid低版...            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2017-12-19 20:10:00
                            
                                1560阅读
                            
                                                                                    
                                2评论
                            
                                                 
                 
                
                             
         
            
            
            
            笔者很热衷于解决Bug,同时比较擅长(网络/协议)部分,所以经常被唤去解决一些网络IO方面的Bug。现在就挑一个案例出来,写出分析思路,以飨读者,希望读者在以后的工作中能够少踩点坑。串包Bug现场前置故障Redis超时由于某个系统大量的hget、hset操作将Redis拖垮,通过监控发现Redis的CPU和IO有大量的尖刺,CPU示意图下图所示:CPU达到了100%,导致很多Redis请求处理不及            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2020-10-24 17:02:39
                            
                                1039阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            解Bug之路-串包Bug 笔者很热衷于解决Bug,同时比较擅长(网络/协议)部分,所以经常被唤去解决一些网络IO方面的Bug。现在就挑一个案例出来,写出分析思路,以飨读者,希望读者在以后的工作中能够...            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-04-19 13:15:08
                            
                                757阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            解Bug之路-Druid的Bug笔者很热衷于解决Bug,同时比较擅长(网络/协议)部分,所以经常被唤去解决一些网络IO方面的Bug。现在就挑一个案例出来,写出分析思路,以飨读者,希望读者在以后的工作中能够少踩点坑。前言此Bug是Druid低版本的Bug,此Bug至少在1.0.12版本就已经修复。Druid的Bug现场在紧张的新项目开发的日子里,突然收到线上某系统的大量报警,对应系统的人员发现此系统            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-04-19 13:29:51
                            
                                2841阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            上面。  这让对应应用的开发百思不得其解,于是求助了笔者一探究竟。怎么发现的应用开发收到Cat监控告警,发现这个应用(A)中的请求在好几台            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-04-19 13:00:25
                            
                                986阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            
 
                                    
                             
         
            
            
            
            我们的分库分表中间件在线上运行了两年多,到目前为止还算稳定。在笔者将精力放在处理各种灾难性事件(例如中间件物理机宕机/数据库宕机/网络隔离等突发事件)时。竟然发现还有一些奇怪的corner case。现在就将排查思路写成文章分享出来。Bug现场应用拓扑应用通过中间件连后端多个数据库,sql会根据路由规则路由到指定的节点,如下图所示:错误现象应用在做某些数据库操作时,会发现有比较大的概率失败。他们的            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2020-10-24 19:34:50
                            
                                314阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            前言我们的分库分表中间件在线上运行了两年多,到目前为止还算稳定。在笔者将精力放在处理各种灾难性事件(例如中间件物理机宕机/数据库宕机/网络隔离等突发事件)时。竟然发现还有一些奇怪的corner case。现在就将排查思路写成文章分享出来。Bug现场应用拓扑应用通过中间件连后端多个数据库,sql会根据路由规则路由到指定的节点,如下图所示:错误现象应用在做某些数据库操作时,会发现有比较大的概率失败。他            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-04-19 13:22:38
                            
                                270阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            主从切换”未成功”?前言数据库主从切换是个非常有意思的话题。能够稳定的处理主从切换是保证业务            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2021-07-20 17:45:13
                            
                                170阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            前言事实证明,读过Linux内核源码确实有很大的好处,尤其在处理问题的时刻。当你看到报错的那一瞬间,就能把现象/原因/以及解决方案一股脑的在脑中闪现。甚至一些边边角角的现象都能很快的反应过来是为何。笔者读过一些LinuxTCP协议栈的源码,就在解决下面这个问题的时候有一种非常流畅的感觉。Bug现场首先,这个问题其实并不难解决,但是这个问题引发的现象倒是挺有意思。先描述一下现象吧,笔者要对自研的du            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2021-02-19 16:45:05
                            
                                199阅读
                            
                                                        
                                点赞
                            
                                                                                    
                                1评论
                            
                                                 
                 
                
                             
         
            
            
            
            前言事实证明,读过Linux内核源码确实有很大的好处,尤其在处理问题的时刻。当你看到报错的那一瞬间,就能把现象/原因/以及解决方案一股脑的在脑中闪现。甚至一些边边角角的现象都能很快的反应过来是为何。笔者读过一些Linux TCP协议栈的源码,就在解决下面这个问题的时候有一种非常流畅的感觉。Bug现场首先,这个问题其实并不难解决,但是这个问题引发的现象倒是挺有意思。先描述一下现象吧,笔者要对自研的d            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2020-10-24 19:26:07
                            
                                505阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            前言事实证明,读过Linux内核源码确实有很大的好处,尤其在处理问题的时刻。当你看到报错的那一瞬间,就能把现象/原因/以及解决方案一股脑的在脑中闪现。甚至一些边边角角的现象都能很快的反应过来是为何。笔者读过一些Linux TCP协议栈的源码,就在解决下面这个问题的时候有一种非常流畅的感觉。Bug现场首先,这个问题其实并不难解决,但是这个问题引发的现象倒是挺有意思。先描述一下现象吧,笔者要对自研的d            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-04-24 11:03:46
                            
                                192阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            解Bug之路-Nginx 502 Bad Gateway前言事实证明,读过Linux内核源码确实有很大的好处,尤其在处理问题的时刻。当你看到报错的那一瞬间,就能把现象/原因/以及解决方案一股脑的在脑中闪现。甚至一些边边角角的现象都能很快的反应过来是为何。笔者读过一些Linux TCP协议栈的源码,就在解决下面这个问题的时候有一种非常流畅的感觉。Bug现场首先,这个问题其实并不难解决,但是这个问题引            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-04-19 12:54:28
                            
                                474阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            前言数据库主从切换是个非常有意思的话题。能够稳定的处理主从切换是保证业务连续性的必要条件。今天笔者就来讲讲主从切换过程中一个小小的问题。故障场景最近线上进行主从切换,大部分应用都切过去了,但是某些应用的连接确还在老的主(新的从)上面。 这让对应应用的开发百思不得其解,于是求助了笔者一探究竟。怎么发现的应用开发收到Cat监控告警,发现这个应用(A)中的请求在好几台机器中一直稳定失败。联想到昨晚刚做过            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2021-04-06 14:15:34
                            
                                491阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            原文:https://www.cnblogs.com/alchemystar/p/13409534.html 解Bug之路-Nginx 502 Bad Gateway 前言 事实证明,读过Linux内核源码确实有很大的好处,尤其在处理问题的时刻。当你看到报错的那一瞬间,就能把现象/原因/以及解决方案            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2020-08-07 10:26:00
                            
                                355阅读
                            
                                                                                    
                                2评论