今天中午公司老官网挂了,无法访问。领导让我帮同事排查。首先NGINX没有问题,其他网站都能访问。然后telnet访问tomcat端口。发现端口已经无法访问。但应用仍在服务器上运行。初步判断是tomcat假死造成的。而能造成tomcat假死的多半就是jvm出问题了。马上在tomcat启动文件中加入jvm的rmi监控命令和gc日志打印命令。应用重启之后,立马发现了端倪。cpu和内存消耗居高不下。然后查            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-09-12 15:00:55
                            
                                28阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            # 如何分析Java宕机问题
## 一、流程概述
为了分析Java宕机问题,我们需要以下步骤:
| 步骤     | 描述                        |
|----------|-----------------------------|
| 1        | 收集宕机时的日志信息           |
| 2        | 使用堆转储工具获取堆转储文件  |            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-03-14 04:15:48
                            
                                68阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            # 分析Java宕机文件
在现代软件开发中,Java是一种广泛应用的编程语言。然而,任何系统都有可能出现宕机(崩溃)情况,Java程序也不例外。理解如何分析Java的宕机文件,对于定位和解决问题至关重要。本文将介绍Java宕机文件的基本结构、如何分析这些文件,并附带示例代码和一个序列图。
## Java宕机的概念
Java宕机通常指的是Java虚拟机(JVM)非正常终止。JVM宕机时,系统会            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-09-21 06:13:05
                            
                                76阅读
                            
                                                                             
                 
                
                             
         
            
            
            
              Linux 内核虽然号称“不死族”,几乎不会崩溃或者死机,但是特殊情况下,还是有一定几率会宕机的。因为 Linux 广泛用于生产环境,所以每一次宕机都会引起相当大的损失。它 Uptime 达到上百天也许你习以为常,但是只要 Down 十几秒,就会立即急的满头大汗。真的很难以想象证交所宕机会怎么样,也许全国股民会闹翻天。所以我们需要一些小技巧来查找死机的原因,从而避免死机或者内核崩溃。            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-29 22:38:27
                            
                                105阅读
                            
                                                                             
                 
                
                             
         
            
            
            
                                      一、能够引起JVM崩溃的常见原因有:  线程阻塞  CPU 使用率过高  JVM Crash  堆内存不足             
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2022-11-30 13:15:05
                            
                                278阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            Linux系统有时会出现宕机的情况,也就是我们所说的死机,如果强制重启可能会导致系统瘫痪,这篇文章主要介绍如何处理Linux系统宕机的问题。希望能Linux 内核虽然号称“不死族”,几乎不会崩溃或者死机,但是特殊情况下,还是有一定几率会宕机的。因为 Linux 广泛用于生产环境,所以每一次宕机都会引起相当大的损失。本文介绍在它死机至后,一种温柔的重启它的办法或命令!当你把你的Linux弄死机了,是            
                
         
            
            
            
            日志分类:1. 连接时间的日志 连接时间日志一般由/var/log/wtmp和/var/run/utmp这两个文件记录,不过这  两个文件无法直接cat查看,并且该文件由系统自动更新,可以通过如下:  w/who/finger/id/last/lastlog/ac 进行查看  [root@xhot ~]# who  root tty1 2010-10-06 22:56  root pts            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-12 09:41:28
                            
                                44阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            ## MongoDB宕机原因分析指南
在工作的过程中,MongoDB宕机是一个常见的问题。为了有效地分析宕机原因,我们可以遵循一套完整的流程。以下是分析步骤的概述:
| 步骤 | 描述                       |
|------|--------------------------|
| 1    | 收集MongoDB日志              |
| 2    |            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-10-29 04:30:01
                            
                                102阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            玩linux系统,经常遇到的一件事就是做了某个操作之后系统会突然挂掉,这要怎么办?
1. 首先我们要看log,看看是否会留下一些蛛丝马迹,比如PC/LR是否有留下来。
 PC是ARM的一个寄存器,即程序计数器,他记下的是当前程序执行的位置;
 LR是link register,它保存的是当前函数的返回地址,
 所以我们可以善用PC/LR来帮助我们查找问题的根源。2. 假设我们知道系统挂掉时的PC值            
                
         
            
            
            
             故事就这样悄无声息发生着?为了赶紧启动第二套方案,把从昨天半夜到今天耗费了差不多十个小时的服务认真思考了一番,是不是可以转化为脚本,这样数据量大的话也很容易插入到数据库,经过一番论证之后,想法是可行的,然后在下午五点的时候,启动了脚本也为后来隐患埋下了雷…在五点脚本跑完之后,几万条数据插入数据库中就开启了这段旅程,惊险刺激,变幻莫测?五点一刻,服务器发生了宕机,用户开始反馈,服务器没有            
                
         
            
            
            
            esxi 主机紫屏原因分析            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2019-04-18 09:49:48
                            
                                10000+阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            IBM WebSphere Application Server 诊断和调优(07年写的,原JavaEye精华帖)博客分类: 
IT技术IBMWebsphereAIXJVMCMS这是上篇文章的续篇,也是07年初发表于JavaEye,被评为精华帖,浏览近四万次,也被各大IT媒体转载(google可查)。基于同样的原因,被删除了)。 对Web            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                            精选
                                                        
                            2014-03-04 14:27:52
                            
                                2510阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            中突然发现一个drainer节点宕机了,且无法拉起,通过查看drainer的日志的关键字 table xx...            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-01-15 11:05:57
                            
                                170阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            1.1 su  切换用户带来的疑惑这是一个客户的案例,客户的一台 Oracle 数据库服务器突然宕机了,由于在线业务的需要,客户没有考虑太多就直接重启了服务器,系统重新启动倒是没有出现问题,可是接下来,当客户准备切换到 oracle 用户下启动数据库时,怎么都无法进行 su 切换,于是问题出现了。1 . 案例现象在 root 用户下,su 切换到一个普通用户 oracle 下,却发生了错            
                
         
            
            
            
                 对于我们而言,经常会遇到服务器服务出现异常的情况,一般情况下,我们可以通过查看应用日志解决。但是有些特殊情况就不适用了。
例如:服务器有段时间总是莫名挂掉了;应用访问变得特别慢;cpu占用突然变高又突然变低等等,这些就涉及到服务器管理相关操作。最常见的异常:1.oom异常,服务器kill应用,我们通常可以通过查看/var/log/mess            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-01 20:26:01
                            
                                99阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            一、发现问题下面是线上机器的cpu使用率,可以看到从4月8日开始,随着时间cpu使用率在逐步增高,最终使用率达到100%导致线上服务不可用,后面重启了机器后恢复。二、排查思路简单分析下可能出问题的地方,分为5个方向:系统本身代码问题 内部下游系统的问题导致的雪崩效应 上游系统调用量突增 http请求第三方的问题 机器本身的问题三、开始排查查看日志,没有发现集中的错误日志,初步排除代码逻辑处理错误。            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-23 23:10:13
                            
                                110阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            对于JVM的内存写过的文章已经有点多了,而且有点烂了,不过说那么多大多数在解决OOM的情况,于此,本文就只阐述这个内容,携带一些分析和理解和部分扩展内容,也就是JVM宕机中的一些问题,OK,下面说下OOM的常见情况:第一类内存溢出,也是大家认为最多,第一反应认为是的内存溢出,就是堆栈溢出:那什么样的情况就是堆栈溢出呢?当你看到下面的关键字的时候它就是堆栈溢出了:java.lang.OutOfMem            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-10 08:23:41
                            
                                55阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            服务器环境:centos6.7 + tomcat7.0.69 + jdk1.7.0_55 + mysql5.6.28 场景:服务刚开始用户体验变差,请求时间长,之后出现404,500等与服务器交互失败问题。重启后用户体验回升,半小时内问题没有再现。 日志中出现的问题有两个: 1、Cause: org            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2020-10-19 21:18:00
                            
                                416阅读
                            
                                                                                    
                                2评论
                            
                                                 
                 
                
                             
         
            
            
            
            
            一.问题描述        在tomcat上,压力测试(并行50,串行100,即5000次)的JAVA程序B44。          压测完毕后(压测试程序已执行完,tomcat也没有任何程序再跑)tomcat就假死了(访问tomcat没反应,无法显示该页)。      &nbs            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-02-27 14:10:57
                            
                                124阅读