前面已经分析了客户端慢、前端页面慢、入口Nginx慢,按照上图接下来就是我们服务端重点的接口慢分析优化、服务器资源性能瓶颈分析、服务器带宽性能瓶颈分析。
性能优化的目的
性能优化的目标是提高应用的性能,使其更加高效、稳定和可靠。性能优化包括服务器优化、操作系统优化、网络优化、web服务器优化、数据库优化、缓存优化、MQ优化、Springcloud优化、Java程序代码优化等方面。
性能优化的依据--监控和日志
java应用跑在服务器上,时间久了,有些功能页面响应慢了,排除前端代码问题、入口Nginx问题,那么剩下的只能是后端问题(服务端接口慢、服务器资源性能瓶颈、服务器带宽性能瓶颈)。如何定位问题,那就只能看监控(操作系统自带的监控命令,java应用的监控Zabbix、Prometheu等),以及日志。
java应用慢下来的表象是用户体验,但是对于一个开发人员来说,表象不仅仅只是用户体验,而是服务器资源的占用以及原因:CPU飙高,有使用SWAP,IOwait,tcp的连接数、time_wait、close_wait等。
要获得这些监控信息,特别是线上实时监控信息,一般都是通过top、htop、sar、netstat、iostat等命令进行CPU性能分析、内存性能分析、磁盘性能分析、网络性能分析。
cpu、网络、重点进程监控,可以参考我之前写的文章。
性能优化的依据--CPU飙高
通过top、htop命令发现有进程的cpu超过100%,而且持续时间长。记住进程号pid,再通过ps -ef|grep pid 定位这个进程是谁;是java进程?还是数据库进程mysqld?亦或者是nginx、redis等进程,也可能是挂的木马进程?
具体问题具体分析:
Java程序的CPU占用过高的原因:
1、无限循环或死循环:程序中存在错误的循环结构,导致程序一直在循环执行,从而消耗大量的CPU资源。
2、复杂的算法和计算:程序中执行复杂的算法、大规模的数据处理或者需要大量计算的操作可能导致CPU占用过高。
3、频繁的IO操作:如果程序频繁地进行文件读写、网络通信等IO操作,可能会导致CPU占用增加。
4、线程问题:多线程程序中,线程可能因为竞争条件、死锁、阻塞等问题导致CPU占用过高。
5、内存问题:内存泄漏或内存占用过高可能导致Java虚拟机频繁进行垃圾回收,从而增加CPU负担。
6、不合理的资源管理:没有正确释放或管理资源,如打开的文件、数据库连接等,可能导致CPU占用过高。
7、第三方库或框架问题:使用的第三方库、框架或组件可能存在性能问题,导致程序CPU占用增加。
8、并发问题:不正确的并发控制或同步机制可能导致竞争条件和性能问题。
9、缓存问题:缓存未有效利用,导致程序频繁地从内存或磁盘读取数据,增加了CPU负担。
10、频繁的异常处理:频繁的异常处理可能会导致CPU占用过高,因为异常处理可能会涉及昂贵的堆栈跟踪等操作。
java程序cpu占用过高的解决方法可:
1、优化代码:检查代码,优化算法、循环和IO操作,减少CPU负担。
2、线程管理:确保多线程程序中的线程正确管理,避免竞争条件和死锁。
3、内存管理:检查内存泄漏,确保释放不再使用的内存。
4、使用合适的工具:使用性能分析工具来检测CPU占用过高的具体位置和原因。
5、代码审查:让同事或专业开发人员进行代码审查,发现潜在的性能问题。
6、进行性能测试:在开发过程中进行性能测试,以确保程序在不同负载下的CPU占用情况。
7、使用合适的框架和库:选择经过优化和高效的第三方库或框架。
解决CPU占用过高问题可能需要详细的分析和调试,特别是在复杂的应用程序中。如果问题仍然存在,就需要专业的开发人员的帮助。
性能优化的依据--jvm监控
接着上面的讲,如果java进程cpu消耗不大,但是java进程就是慢,怎么办?这个时候需要更精细的监控jvm内存监控、gc监控、gc日志、以及当前接口操作的整个链路。由于篇幅原因,这里就不再展开,后面详说。
性能优化的参考--基准测试
一般在采购前,都会用厂商提供的服务器进行一个基准测试,用来评估服务器性能。在这里我们就提一嘴,可以用sysbench。
sysbench是一个模块化的、跨平台、多线程基准测试工具,主要用于评估测试各种不同系统参数下的数据库负载情况。
主要包括以下几种方式的测试:
1、cpu性能
2、磁盘io性能
3、调度程序性能
4、内存分配及传输速度
5、POSIX线程性能
6、数据库性能(OLTP基准测试)
衡量结果标准:
cpu性能测试:找范围内最大素数时间越短越好
线程调度:线程并发执行,循环响应信号量花费的时间越少越好
互斥锁:并发线程同时申请互斥锁循环一定次数花费的时间越少越好
内存:以不同块大小传输一定数量的数据吞吐量大小越大越好
IO:不同场景下IO TPS越大越好