Jobhistoryserver yarn

原创

mob64ca12f5c08e 2024-06-03 06:45:01 ©著作权

©著作权归作者所有：来自51CTO博客作者mob64ca12f5c08e的原创作品，请联系作者获取转载授权，否则将追究法律责任

了解JobHistoryServer YARN

在Apache Hadoop生态系统中，JobHistoryServer是一个独立的服务，用于存储和展示YARN应用程序的历史信息。通过JobHistoryServer，用户可以查看以前运行过的YARN应用程序的详细信息，包括任务执行的情况、日志记录等。

JobHistoryServer的作用

JobHistoryServer主要有以下几个作用：

存储历史信息：JobHistoryServer会将YARN应用程序的历史信息保存在HDFS上，以便用户随时查看。
提供Web界面：用户可以通过Web界面访问JobHistoryServer，查看应用程序的详细信息。
可视化展示：JobHistoryServer会将YARN应用程序的信息以图表形式展示，帮助用户更直观地了解应用程序的运行情况。

如何启动JobHistoryServer

要启动JobHistoryServer，首先需要确保Hadoop集群中已经启动了YARN服务。然后，按照以下步骤操作：

编辑mapred-site.xml文件，添加以下配置：

<property>
  <name>mapreduce.jobhistory.address</name>
  <value>jobhistoryserver:10020</value>
</property>
<property>
  <name>mapreduce.jobhistory.webapp.address</name>
  <value>jobhistoryserver:19888</value>
</property>

启动JobHistoryServer：

$ yarn jobhistoryserver

JobHistoryServer的Web界面

JobHistoryServer提供了一个Web界面，用户可以通过浏览器访问该界面查看应用程序的历史信息。以下是JobHistoryServer的Web界面中可能包含的信息：

历史任务执行情况

通过表格展示各个任务的执行情况，包括任务的状态、启动时间、完成时间等。示例表格如下：

任务ID	状态	启动时间	完成时间
task_001	完成	2022-01-01 10:00:00	2022-01-01 10:10:00
task_002	失败	2022-01-01 10:05:00	2022-01-01 10:15:00

日志记录

JobHistoryServer会记录应用程序的日志信息，用户可以查看任务执行过程中的日志输出。

可视化展示

JobHistoryServer还会将YARN应用程序的信息以图表形式展示，帮助用户更直观地了解应用程序的运行情况。以下是一个示例饼状图：

pie
  title YARN应用程序状态
  "成功" : 70
  "失败" : 30

总结

通过本文的介绍，我们了解了JobHistoryServer在YARN中的作用以及如何启动和使用JobHistoryServer。JobHistoryServer为用户提供了查看YARN应用程序历史信息的便利性，帮助用户更好地管理和监控应用程序的运行情况。如果您是Hadoop集群的管理员或开发人员，建议您深入学习和了解JobHistoryServer的相关知识，以便更好地利用Hadoop集群资源。