关于jmeter分布式压测如何搭建网上的文章很多,搭建过程本文不再赘述,主要讨论可能的报错以及解决方案,下面的内容可能查阅的频率很高,强烈建议收藏。

问题1

报错:

Created the tree successfully using test.jmx
Configuring remote engine: 192.157.20.1
Connection refused to host: 192.157.20.1; nested exception is:
        java.net.ConnectException: Connection refused
Failed to configure 192.157.20.1
Stopping remote engines
Remote engines have been stopped
Error in NonGUIDriver java.lang.RuntimeException: Following remote engines could not be configured:[192.157.20.1]
An error occurred: Error in NonGUIDriver Following remote engines could not be configured:[192.157.20.1]

解决方案1:这个其实是你从压力机的jmeter-server没有开启,提供一条后台启动方式,如果不使用后台启动,进程可能随着你操作shell的关闭而关闭

nohup ~/apache-jmeter-5.2.1/bin/jmeter-server > Log.log 2>&1 &

问题2 

报错:

Created the tree successfully using myaccount.jmx
Configuring remote engine: 192.157.20.1
Starting distributed test with remote engines: [192.157.20.1] @ Tue May 12 10:38:06 CST 2020 (1589251086882)
Remote engines have been started:[192.157.20.1]
Waiting for possible Shutdown/StopTestNow/HeapDump/ThreadDump message on port 4445
summary =      0 in 00:00:00 = ******/s Avg:     0 Min: 9223372036854775807 Max: -9223372036854775808 Err:     0 (0.00%)
Tidying up remote @ Tue May 12 10:38:09 CST 2020 (1589251089904)

解决方案2:

出现以上情况原因及解决办法:1、jmeter脚本和测试数据(如果有的话)主机和从机两边都要存放。且controller中jmeter脚本、测试数据的存放路径和agent中jmeter脚本、测试数据的存放路径一致。

2、在原因1的基础上,controller的测试数据地址要用绝对路径(参数化文件),agent的测试数据绝对路径或相对路径均可。

问题3: 

连接slave,connect refuse 

解决方案3:

防火墙状态查询,如果开了请关闭;

controller和agent在同一网段,先进行网络测试。

问题4: 

master、slave的时间要同步,否则tps结果误差较大。

问题5:

报错rmi-keystore.jks(系统找不到指定文件);

解决方案5:

JMeter/bin中的jmeter.properties文件中修改 server.rmi.ssl.disable=true

问题6: 

压力无法上去或者qps波动很大 压力无法上去涉及到的方方面面很多,我仅从压力机本身举两个例子 ;

解决方案6

确认master和slave在同一个网段,并监控相关数据 ;

发起压力的同时查看服务网络连接状态,可以用这个命令:

netstat -ant|awk '/^tcp/ {++S[$NF]} END {for(a in S) print (a,S[a])}'

当我们看到timewait数值很高时,可以做一些内核参数优化

vi /etc/sysctl.conf
net.ipv4.tcp_keepalive_time = 1200 
#表示当keepalive起用的时候,TCP发送keepalive消息的频度。缺省是2小时,改为20分钟。
net.ipv4.ip_local_port_range = 1024 65000 
#表示用于向外连接的端口范围。缺省情况下很小:32768到61000,改为1024到65000。
net.ipv4.tcp_max_syn_backlog = 8192 
#表示SYN队列的长度,默认为1024,加大队列长度为8192,可以容纳更多等待连接的网络连接数。
net.ipv4.tcp_max_tw_buckets = 5000 
#表示系统同时保持TIME_WAIT套接字的最大数量,如果超过这个数字,TIME_WAIT套接字将立刻被清除并打印警告信息。
默认为180000,改为5000。对于Apache、Nginx等服务器,上几行的参数可以很好地减少TIME_WAIT套接字数量,但是对于 Squid,效果却不大。此项参数可以控制TIME_WAIT套接字的最大数量,避免Squid服务器被大量的TIME_WAIT套接字拖死。

然后执行 /sbin/sysctl -p 让参数生效

问题7:

报错:

 Couldn't flush user prefs: java.util.prefs.BackingStoreException: Couldn't get file lock

解决方案7:

这个原因是linux中限制了默认打开文件的数量 ulimit -n 100000

问题8:

很多同学使用命令行会动态传入线程数等,分布式是失效的;