处理过线上问题的同学基本上都会遇到系统突然运行缓慢,CPU 100%,以及 Full GC 次数过多的问题。当然,这些问题最终导致的直观现象就是系统运行缓慢,并且有大量的报警。本文主要针对系统运行缓慢这一问题,提供该问题的排查思路,从而定位出问题的代码点,进而提供解决该问题的思路。对于线上系统突然产生的运行缓慢问题,如果该问题导致线上系统不可用,那么首先需要做的就是,导出 jstack 和内存信息            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-07-09 23:04:55
                            
                                111阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            摘要 最近线上一个服务又出现了频繁Full GC的情况,导致提供的业务经常超时。问题出现非常不稳定,经过两周的时候,终于又捕捉到了一次Full GC,于是联系运维做Heap Dump之后,经过一系列分析,终于解决问题。这次的问题稍微复杂一点,但是也比较有代表性,用到了VisualVM和MAT两个工具,继续记录如下。
最近线上一个服务又出现了频繁Full GC的情况,导致提供的业务经常超时            
                
         
            
            
            
            一、外在表现前段时间系统经常出现OOM,服务很不稳定,偶尔会有java进程不存在的情况,临时解决方案只能是重启。 二、辅助工具1.top用top查看,发现内存占用(%MEM)挺多,其他指标均正常。 2.dmesg如果发现自己的java进程突然消失了,那么就要借助dmesg来查看开机之后的系统日志命令为dmesg | grep -i 'kill'或者搜索oom(out of me            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-11-01 17:47:22
                            
                                104阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            在我们另一个工程师查看一台H3C5500设备配置的时候发现一个环路现象,就是在5500的38口和20口传上来的MAC地址有重复,虽然这两个口属于不同的VLAN,38口是vlan400,20口是vlan100。但是,毋庸置疑,物理线路环起来了!!!因为涉及后期的一项工程,我们不得不解决这个故障,虽然现在没有影响,但是这是个隐患。必须解决。首先我们已经确定38口和20口是环路,好在各自划了vlan,并            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-20 19:31:58
                            
                                142阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            核心要点排查Java的内存问题可能会非常困难,但是正确的方法和适当的工具能够极大地简化这一过程;Java HotSpot JVM会报告各种OutOfMemoryError信息,清晰地理解这些错误信息非常重要,在我们的工具箱中有各种诊断和排查问题的工具,它们能够帮助我们诊断并找到这些问题的根本原因;在本文中,我们会介绍各种诊断工具,在解决内存问题的时候,它们是非常有用的,包括:HeapDumpOnO            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-17 05:52:00
                            
                                106阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            引言在Java开发过程中,有效的内存管理是保证应用程序稳定性和性能的关键。不正确的内存使用可能导致内存泄露甚至是致命的OutOfMemoryError(OOM)。为了避免这些问题,本文将分享10个关于Java内存管理的实用技巧。正文1、使用弱引用和软引用弱引用(WeakReference)和软引用(SoftReference)可以在内存不足时被自动回收,适用于实现缓存等功能。最近无意间获得一份阿里            
                
         
            
            
            
            专注于Java领域优质技术,欢迎关注作者:fredalxin线上故障主要会包括 CPU、磁盘、内存以及网络问题,而大多数故障可能会包含不止一个层面的问题,所以进行排查时候尽量四个方面依次排查一遍。同时例如 jstack、jmap 等工具也是不囿于一个方面的问题的,基本上出问题就是 df、free、top 三连,然后依次 jstack、jmap 伺候,具体问题具体分析即可。CPU一般来讲我们首先会排            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-11-29 10:40:21
                            
                                192阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            文章目录一、问题排查一:SQL执行出错二、问题排查二:慢查询0.几个重要参数1.配置慢查询日志命令行配置(重启失效)修改配置文件(永久生效)2.查看慢查询日志3.问题排查1:Look_time耗时4.问题排查2:索引5.问题排查3:拆解复杂SQL参考 一、问题排查一:SQL执行出错使用工具: Navicat for MySQL当执行了一条错误的SQL语句,会显示错误信息,包含了错误码、错误详情。            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-16 06:32:15
                            
                                68阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            要知道,网络排障作为每个网工的必备基础,如果能好用的网络故障排除工具高效提升你的工作效率,对于领导来说,绝对是加分项。善用工具也是一种很强大的能力。通过高效的工具,你能够分析究竟网络在这期间究竟发生了什么事情,而不会再一头雾水。今天就为大家介绍5个好用的网络排障工具。01、IP Tools:Network Utilities局域网分析工具 IP Tools Network Utilitie是一款功            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-11-03 08:15:06
                            
                                99阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            一: 问题背景与现象   1、健康检查失败   2、接口测试反应慢   3、系统多次CPU或内存使用率飙升,且是java进程引起二: 解决问题思路   1.确定服务已部署成功且没有被回收,健康状态检查成功,打开终端控制面板,登录服务器,若不能直接登录则先登录跳板机,再登录服务器,执行jps命令查看服务进程是否还存在2.            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-27 20:28:58
                            
                                127阅读
                            
                                                                             
                 
                
                             
         
            
            
            
              最近在工作中用到拼音搜索,目前参考靠网上的例子做出一套,在这跟大家分享一下。这套代码可以识别包快拼音缩写在内的拼音与汉字混合的字符串(例如:xiug手机h --> 修改手机号)话不多说,直接开始:   
 1. 首先有一张中文词语对应拼音的表,然后建一张词语点击量的表(用于记录词语的常用度)PinyinWord tableCREATE TABLE "public"."pinyinword            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-19 09:01:54
                            
                                62阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            简介Arthas 是Alibaba开源的Java诊断工具,动态跟踪Java代码;实时监控JVM状态,可以在不中断程序执行的情况下轻松完成JVM相关问题排查工作 。支持JDK 6+,支持Linux/Mac/Windows。这个工具真的很好用,而且入门超简单,十分推荐。使用场景这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?我改的代码为什么没有执行到?难道是我没 commi            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-11 21:39:50
                            
                                189阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
                                             网络排查 配置好之后从新启动,然后开始拼网站 拼不通,开始排查 虚拟机最左下角有个网络设置,打开选择桥接模式试一下。如上图如上图dhc            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2017-10-19 02:05:17
                            
                                798阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            故障排查            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2018-04-26 12:07:49
                            
                                703阅读
                            
                                                        
                                点赞
                            
                                                                             
                 
                
                             
         
            
            
            
            路由网络故障排查            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2018-02-02 20:10:52
                            
                                1277阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            一、故障现象局域网内各主机通信故障,无法进行正常通信。二、故障排除步骤1、通过pc1 ping 局域网内任意一台主机,无响应 2、 通过pc2 ping局域网内任意一台主机,无响应,判定局域网内通信瘫痪 3、 通过pc1 ping 局域网内同vlan的主机 ,无响应,计算机ip配置,vlan划分,交换机接口access与trunk配置可能存在问题。4、查看同一vlan下pc的ip配置情况 5、查看            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-28 09:43:16
                            
                                76阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            jvm问题排查一直没有自己的思路体系,这次测试环境发现了一个cpu飙高的问题,刚好用来实践一次,纸上得来终觉浅,绝知此事要躬行。最后捋一下思路和过程,记录定位java进程linux, top 命令,发现 23071进程cpu,内存均占比很高排查cpu问题,对于jvm如何排查cpu占用?当然是要找到具体的内部线程查看进程内的线程资源占用使用命令,top -Hp 23071,发现这些线程cpu占用很高            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-27 23:10:57
                            
                                101阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            某Java服务(假设PID=19813)出现了OOM,最常见的原因为: 有可能是内存分配确实过小,而正常业务使用了大量内存 某一个对象被频繁申请,却没有释放,内存不断泄漏,导致内存耗尽 某一个资源被频繁申请,系统资源耗尽,例如:不断创建线程,不断发起网络连接 三种情况:1 “本身资源不够”2 “申请资源太多”3: “资源耗尽”。  更具体的,可以使用以下工具逐一排查。jps列出所有jav            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-09 23:39:39
                            
                                83阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1.出现的情景:第一天测试,tps100左右,第二天测试tps5左右,平均响应时间很大。查看监控发现内存很高,CPU也70%左右。确认代码环境都没有变动。查看程序日志,发现报错,显示Caused by: java.lang.OutOfMemoryError: GC overhead limit exceeded,查看tomcat的JVM配置,为3G,内存监控为3G,爆满。Jprofile显示cha            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2017-09-28 11:23:29
                            
                                1792阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            实验名称:故障排错实现全网互通实验拓扑:排错思路1、先排查PC机2、排查SW23、排查SW34、排查SW15、排查AR16、排查AR27、排查AR3实验步骤:排查修改SW2<SW2>undotmInfo:Currentterminalmonitorisoff.<SW2>sysEntersystemview,returnuserviewwithCtrl+Z.[SW2]dis[            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2018-01-24 15:58:52
                            
                                8653阅读
                            
                                                        
                                点赞