如何在HUE上通过oozie调用Spark工作流

原创

create17 2021-07-07 10:23:06 ©著作权

文章标签 HUE 文章分类 代码人生

©著作权归作者所有：来自51CTO博客作者create17的原创作品，请联系作者获取转载授权，否则将追究法律责任

HUE版本：3.12.0

Spark版本：1.6.3

Ambari版本：2.6.1.0

HDP版本：2.6.4

前言

通过浏览器访问ip:8888登陆HUE界面，首次登陆会提示你创建用户，这里使用账号/密码：hue/hue登陆。

访问ip:8888/about/#step2，点击下载Oozie Editor/Dashboard，可以下载应用程序示例。如下图所示：

如何在HUE上通过oozie调用Spark工作流_HUE

下载完成之后，访问workflow编辑器，会看到spark的程序示例。在这对该示例如何执行进行讲解。如下两图所示：

如何在HUE上通过oozie调用Spark工作流_HUE_02

通过启动Spark Java程序复制文件到HDFS文件系统中。

点击spark示例程序，点击“工作区”，如下图所示：

如何在HUE上通过oozie调用Spark工作流_HUE_04

将本地/usr/hdp/2.6.4.0-91/spark/lib目录下的jar包上传到上述工作区的lib文件夹内，执行命令：

sudo -u hdfs hadoop fs -put /usr/hdp/2.6.4.0-91/spark/lib/*  /user/hue/oozie/workspaces/workflows/spark-scala/lib/

执行结果如图所示：

如何在HUE上通过oozie调用Spark工作流_HUE_05

点击“编辑”，出现如下图所示，其中jar/py名称是oozie-examples.jar，main class(主类)是org.apache.oozie.example.SparkFileCopy，参数为：${input}，${output}。在这里，我们保持默认配置。如下图所示：

如何在HUE上通过oozie调用Spark工作流_HUE_06

点击“设置”，可以更改Workflow设置，其中变量input的值就是我们要复制的文件路径。在这里，我们保持默认配置，如下图所示：

如何在HUE上通过oozie调用Spark工作流_HUE_07

点击“执行”按钮，选择output输出路径，这里我选择输出到该示例的工作区: /user/hue/oozie/workspaces/workflows/spark-scala/output，点击“提交”。

备注：输出路径会自动生成，不能选择已有文件。

打开/user/hue/oozie/workspaces/workflows/spark-scala/output，会生成三个文件，如下图所示：

如何在HUE上通过oozie调用Spark工作流_HUE_08

在HUE上通过oozie调用Spark工作流：

如何在HUE上通过oozie调用Spark工作流_HUE_09

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯