问题描述
总所周知,jacoco的dump操作如果是使用server模式只需要使用以下命令就能获取到 exec 文件。
java -jar jacococli.jar dump --address 192.169.110.1 --port 6300 --destfile ./jacoco-demo.exec
如果是非 k8s 的集群,也只需要遍历执行这条命令即可,但是对于 k8s 服务的处理有有点力所不逮。
当我们使用 k8s 部署服务后,应用实例将会无状态话,用户不再去关心实例的 ip,端口等信息,service 自动会帮我们做负载均衡等操作,pod 不会暴露出 ip 和端口等信息给集群外部访问,这样对我们的 dump 操作带来了困难。
问题解决
针对上述问题,网络上也有一些解决方案,最常用的方式是切换 jacooc server 模式为 client 模式,这样当 jvm 关闭时就会将 dump 数据写入指定服务的文件里。虽然能从一定程度解决问题,但是这样生成报告的节奏就会被打断,就不能随时生成报告了,这里提供一种解决方式。
首先,我们还是采用 server 模式,在服务启动时注入
-javaagent:/jacoco/agent/jacocoagent.jar=includes=*,output=tcpserver,port=6300,address=0.0.0.0
然后,当我们想要去获取 exec 文件时,可以在 pod 中执行
java -jar /jacoco/agent/jacococli.jar dump --address 127.0.0.1 --port 36300 --destfile /app/jacoco.exec
然后我们从 pod 读取文件/app/jacoco.exec 写入我们的报告生成服务即可
怎么去 pod 内部执行 shell 命令,各种手动都有,这里我们 java 基于一个 k8s 的 sdk 工具 fabric8 实现
public List<String> dumpK8sExecData(K8sDumpParam k8sDumpParam) {
try {
String dumpCmd = "JAVA_TOOL_OPTIONS=\"\" java -jar /jacoco/agent/jacococli.jar dump --address 127.0.0.1 --port 6300 --destfile /app/jacoco.exec";
if (k8sDumpParam.getResetFlag()) {
dumpCmd += " --reset";
}
String[] cmd = {"sh", "-c", dumpCmd};
K8sCmdParam k8sCmdParam = OrikaMapperUtils.map(k8sDumpParam, K8sCmdParam.class);
k8sCmdParam.setCmd(cmd);
k8sCmdParam.setExecutor(executor);
return executeCmd(k8sCmdParam);
} catch (Exception e) {
log.error("dump操作失败,失败原因:", e);
throw new BizException(BizCode.JACOCO_DUMP_ERROR);
}
public List<String> executeCmd(K8sCmdParam k8sCmdParam) {
KubernetesClient client = K8sClientProxy.getOrCreateClient(k8sCmdParam.getKubeConfig());
if (client == null || k8sCmdParam.getNameSpace() == null || CollectionUtil.isEmpty(k8sCmdParam.getPodList())) {
throw new BizException(BizCode.JACOCO_DUMP_PARAM_ERROR);
}
List<CompletableFuture<String>> priceFuture = k8sCmdParam.getPodList().stream().map(pod ->
CompletableFuture.supplyAsync(() -> {
String filename = "";
// 异步操作
dumpFileService.podExec(pod, k8sCmdParam.getCmd(), k8sCmdParam.getNameSpace(), client);
try {
//中间等待文件写入一段时间,再去尝试获取
Thread.sleep(1000);
filename = dumpFileService.downloadFile(pod, k8sCmdParam.getNameSpace(), client, k8sCmdParam.getTaskWorkspace());
} catch (Exception e) {
throw new BizException(BizCode.DUMP_FILE_GET_ERROR);
}
return filename;
}, k8sCmdParam.getExecutor())
).collect(Collectors.toList());
// 等待所有异步操作完成,多个pod并发执行以上操作,减少dump的时间消耗
CompletableFuture.allOf(priceFuture.toArray(new CompletableFuture[0])).join();
return priceFuture.stream().map(CompletableFuture::join).filter(Objects::nonNull).collect(Collectors.toList());
}
/**
* 执行单个pod命令
*
* @param podName pod名字
* @param cmd cmd
* @param namespace 名称空间
* @param client 客户端
*/
public void podExec(String podName, String[] cmd, String namespace, KubernetesClient client) {
try (ExecWatch watch = client.pods().inNamespace(namespace)
.withName(podName)
.redirectingOutput()
.exec(cmd)) {
}
}
/**
* 获取文件
*
* @param podName pod名字
* @param namespace 名称空间
* @param client 客户端
* @param workspace 工作空间
*/
@Retryable(value = {IOException.class}, backoff = @Backoff(delay = 1000))
public String downloadFile(String podName, String namespace, KubernetesClient client, String workspace) throws IOException {
try (InputStream is = client.pods().inNamespace(namespace)
.withName(podName)
.file("/app/jacoco.exec").read()) {
String execPath = workspace + "/exec/" + podName + "/jacoco.exec";
FileUtil.writeFromStream(is, execPath);
return execPath;
}
}
这里有两个细节点
- Thread.sleep(1000) 操作,是因为执行 dump 命令后,我们无法判定 exec 文件什么时候能在本地生成完成,立马获取就会抛出 IO 异常,等待一定时间后即可获取到文件,这个时间的等待只是第一层保障,具体等待时间,可以视自己的 dump 文件大小调整,当然哪怕没调整也没有关系
- @Retryable(value = {IOException.class}, backoff = @Backoff(delay = 1000)) 这段代码是使用了 spring 的一个重试框架,当文件获取失败后,默认会重试 3 次,每次重试间隔 1 秒,这是获取文件的第二步保障,用户可以通过调整重试次数来减少文件获取失败风险
这里说明下 spring Retryable 必须在 public 方法上,而且调用它的方法不能和他处于同一个类,否则不会生效重试。
通过以上手段就可以主动去 dump 出想要的数据,当然更好的方式是判断 exec 文件是否存在,或者还在写入中,等写入完成再去获取文件,这个操作也可以通过 shell 去完成,本文只是提供一种实现方案。