cdh怎么查看yarn日志 yarn的日志在哪看

转载

mob6454cc78d412 2024-08-12 12:57:08

文章标签 cdh怎么查看yarn日志大数据数据库 hadoop 应用程序 文章分类 Yarn 大数据

1.理论解说

1.1 YARN简介

Apache Hadoop YARN（Yet Another Resource Negotiator）是Hadoop集群资源管理器，用于管理集群中的资源分配和作业调度。它的核心作用是将资源管理与作业调度分离，提供了灵活的资源管理框架。

1.2 日志的重要性

日志是开发和调试过程中的重要工具，它记录了程序的运行过程、异常情况和关键信息。通过分析日志，我们可以定位问题、了解系统状态，利于调试和问题排查。

1.3 调试技巧的重要性

调试是开发过程中不可或缺的一环，有效的调试技巧可以快速定位问题，提高开发效率。YARN作为一个分布式计算框架，调试是必不可少的。

2.日志技巧

2.1 日志级别

YARN的日志级别分为ERROR、WARN、INFO、DEBUG和TRACE五个级别，根据不同的需求，可以设置不同的日志级别。

2.1.1 ERROR

ERROR级别用于记录程序中的错误信息，这些错误是无法继续执行的，需要进行相应的修复。

2.1.2 WARN

WARN级别用于记录警告信息，这些警告信息可能不会导致程序执行失败，但是需要开发人员关注和处理。

2.1.3 INFO

INFO级别用于记录一些重要信息，如程序启动、停止等关键事件，以及程序中的重要运行状态。

2.1.4 DEBUG

DEBUG级别用于记录程序的详细运行信息，如变量的取值、函数的调用等，主要用于调试程序。

2.1.5 TRACE

TRACE级别用于记录最详细的运行信息，一般情况下不开启，因为会产生大量日志信息。

2.2 自定义日志

在YARN中，可以通过自定义日志函数来记录自己感兴趣的信息。例如，可以在程序中添加一个函数，用于记录一些自定义的调试信息。

2.3 日志格式化

YARN的日志输出一般采用了格式化的方式，可以通过配置文件调整日志的输出格式，包括时间、线程、日志级别等信息。可以根据实际需要进行调整。

3.调试技巧

3.1 远程调试

对于需要开发调试的YARN应用程序，可以使用远程调试来定位问题。可以通过在IDE中连接到远程运行的YARN服务，设置断点，并逐步调试程序。

3.2 堆栈跟踪

堆栈跟踪是在发生异常时输出的一段调用栈信息，能够帮助我们定位异常发生的位置。在YARN开发过程中，遇到异常时，可以查看堆栈跟踪信息，找到异常出现的源头。

3.3 日志分析工具

为了更好地分析和定位问题，可以使用一些常用的日志分析工具，如ELK（Elasticsearch + Logstash + Kibana）、Splunk等。

4.完整代码注释案例

以下是一个在YARN framework中使用日志和调试技巧的示例：

cdh怎么查看yarn日志 yarn的日志在哪看_hadoop

import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.yarn.conf.YarnConfiguration; import org.apache.hadoop.yarn.api.records.FinalApplicationStatus; import org.apache.hadoop.yarn.api.records.ApplicationReport; import org.apache.hadoop.yarn.client.api.YarnClient; import org.apache.hadoop.yarn.client.api.YarnClientApplication; import org.apache.hadoop.yarn.client.api.YarnClientFactory; import org.apache.hadoop.yarn.client.api.async.NMClientAsync; import org.apache.hadoop.yarn.client.api.async.impl.NMClientAsyncImpl; public class YarnApplication { private static final String APPLICATION_NAME = "YARN Application"; private YarnClient yarnClient; private NMClientAsync nmClient; public YarnApplication() { Configuration conf = new YarnConfiguration(); yarnClient = YarnClientFactory.createYarnClient(); yarnClient.init(conf); nmClient = NMClientAsyncImpl.createNMClientAsync(); nmClient.init(conf); } public void runApplication() throws Exception { yarnClient.start(); ApplicationReport applicationReport = submitApplication(); // 获取应用程序的状态 FinalApplicationStatus status = applicationReport.getFinalApplicationStatus(); System.out.println("Application status: " + status); // 打印应用程序日志 printApplicationLogs(applicationReport); yarnClient.stop(); } private ApplicationReport submitApplication() throws Exception { YarnClientApplication app = yarnClient.createApplication(); // 设置应用程序的相关参数 // ... // 提交应用程序 yarnClient.submitApplication(app.getApplicationSubmissionContext()); // 等待应用程序运行完成 ApplicationReport applicationReport = yarnClient.getApplicationReport(app.getApplicationSubmissionContext().getApplicationId()); while (!isApplicationFinished(applicationReport)) { applicationReport = yarnClient.getApplicationReport(app.getApplicationSubmissionContext().getApplicationId()); Thread.sleep(1000); } return applicationReport; } private boolean isApplicationFinished(ApplicationReport report) { return report.getYarnApplicationState().isFinalState(); } private void printApplicationLogs(ApplicationReport report) { // 获取应用程序的日志路径 String logPath = report.getLogAggregationStatusURI().toString(); // 根据实际路径获取日志内容并打印 // ... } public static void main(String[] args) throws Exception { YarnApplication application = new YarnApplication(); application.runApplication(); } }

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.yarn.conf.YarnConfiguration;
import org.apache.hadoop.yarn.api.records.FinalApplicationStatus;
import org.apache.hadoop.yarn.api.records.ApplicationReport;
import org.apache.hadoop.yarn.client.api.YarnClient;
import org.apache.hadoop.yarn.client.api.YarnClientApplication;
import org.apache.hadoop.yarn.client.api.YarnClientFactory;
import org.apache.hadoop.yarn.client.api.async.NMClientAsync;
import org.apache.hadoop.yarn.client.api.async.impl.NMClientAsyncImpl;

public class YarnApplication {
private static final String APPLICATION_NAME = "YARN Application";
 
private YarnClient yarnClient;
private NMClientAsync nmClient;
 
public YarnApplication() {
Configuration conf = new YarnConfiguration();
    yarnClient = YarnClientFactory.createYarnClient();
    yarnClient.init(conf);
    nmClient = NMClientAsyncImpl.createNMClientAsync();
    nmClient.init(conf);
  }
 
public void runApplication() throws Exception {
    yarnClient.start();
ApplicationReport applicationReport = submitApplication();
   
    // 获取应用程序的状态
FinalApplicationStatus status = applicationReport.getFinalApplicationStatus();
    System.out.println("Application status: " + status);
   
    // 打印应用程序日志
    printApplicationLogs(applicationReport);
   
    yarnClient.stop();
  }
 
private ApplicationReport submitApplication() throws Exception {
YarnClientApplication app = yarnClient.createApplication();
 
    // 设置应用程序的相关参数
    // ...
   
    // 提交应用程序
    yarnClient.submitApplication(app.getApplicationSubmissionContext());
   
    // 等待应用程序运行完成
ApplicationReport applicationReport = yarnClient.getApplicationReport(app.getApplicationSubmissionContext().getApplicationId());
while (!isApplicationFinished(applicationReport)) {
      applicationReport = yarnClient.getApplicationReport(app.getApplicationSubmissionContext().getApplicationId());
      Thread.sleep(1000);
    }
   
return applicationReport;
  }
 
private boolean isApplicationFinished(ApplicationReport report) {
return report.getYarnApplicationState().isFinalState();
  }
 
private void printApplicationLogs(ApplicationReport report) {
    // 获取应用程序的日志路径
String logPath = report.getLogAggregationStatusURI().toString();
   
    // 根据实际路径获取日志内容并打印
    // ...
  }
 
public static void main(String[] args) throws Exception {
YarnApplication application = new YarnApplication();
    application.runApplication();
  }
}

参数介绍 APPLICATION_NAME: 应用程序的名称，用于标识应用程序。

在这个示例中，我们创建了一个YARN应用程序类YarnApplication。在构造函数中初始化了YarnClient和NMClientAsync对象，用于与YARN集群进行交互。runApplication()方法用于运行应用程序。

在submitApplication()方法中，我们创建一个YarnClientApplication对象，设置相关参数并提交应用程序。然后，通过循环等待应用程序运行完成，并打印应用程序的状态和日志。

以上的示例代码中还有一些参数和方法没有具体实现，这些部分可以根据实际需求进行补充。