Spark集群搭建与并验证环境是否搭建成功(三台机器)

关注 WEL测试

文章目录

1.Spark集群需要的软件
2.安装Scala与Spark
2.1 安装scala
2.2 安装Spark
3.启动并查看集群状况

Spark集群搭建与并验证环境是否搭建成功(三台机器)

原创

WEL测试 2022-06-18 00:25:24 ©著作权

文章标签 Spark集群搭建 spark scala spark环境配置大数据 文章分类 虚拟化云计算

©著作权归作者所有：来自51CTO博客作者WEL测试的原创作品，请联系作者获取转载授权，否则将追究法律责任

在之前hadoop的基础上，进行Spark分布式集群：

(1)下载Spark集群需要的基本软件，本篇需要的是：Scala-2.10.4、spark-1.4.0-bin-hadoop

(2)安装Spark集群需要的每个软件

(3)启动并查看集群的状况

(4)t通过spark-shell测试spark工作

1.Spark集群需要的软件

在前面构建好的hadoop集群的基础上构建spark集群，这里需要的软件主要是：Scala-2.10.4、spark-1.4.0-bin-hadoop，从网上可以下载到这两个版本的安装包，以防万一，我这里提供下载地址：http://pan.baidu.com/s/1kVFtn9d 密码：6o36

2.安装Scala与Spark

2.1 安装scala

在Master节点上，打开终端执行命令：mkdir /usr/llib/scala,进入到下载文件目录下，解压scala压缩文件，执行类似于下图操作：

Spark集群搭建与并验证环境是否搭建成功(三台机器)_spark

把解压的scala文件移动到创建的目录下！

修改环境变量，操作截图如下：

Spark集群搭建与并验证环境是否搭建成功(三台机器)_Spark集群搭建_02

执行下图所示操作，使环境配置修改生效，并检测scala是否安装成功！

Spark集群搭建与并验证环境是否搭建成功(三台机器)_大数据_03

在命令行，直接输入scala进入scala命令交互界面，操作如下截图：

Spark集群搭建与并验证环境是否搭建成功(三台机器)_spark_04

关于Slave1与Slave2的操作截图如下所示：

Spark集群搭建与并验证环境是否搭建成功(三台机器)_spark环境配置_05

Spark集群搭建与并验证环境是否搭建成功(三台机器)_spark环境配置_06

由于gedit无法使用，所以通过scp命令进行了复制！

Spark集群搭建与并验证环境是否搭建成功(三台机器)_scala_07

Spark集群搭建与并验证环境是否搭建成功(三台机器)_spark_08

Spark集群搭建与并验证环境是否搭建成功(三台机器)_spark环境配置_09

Spark集群搭建与并验证环境是否搭建成功(三台机器)_spark_10

2.2 安装Spark

进入到下载目录下，解压spark压缩文件：

Spark集群搭建与并验证环境是否搭建成功(三台机器)_Spark集群搭建_11

打开终端，执行命令：mkdir /usr/local/spark，移动解压的spark文件，操作截图：

Spark集群搭建与并验证环境是否搭建成功(三台机器)_scala_12

配置spark环境变量，操作截图如下：

Spark集群搭建与并验证环境是否搭建成功(三台机器)_大数据_13

执行如下命令，是修改配置生效：

Spark集群搭建与并验证环境是否搭建成功(三台机器)_Spark集群搭建_14

进入到spark的conf目录下，把spark-env.sh.template文件拷贝到spark-env.sh，并进行编辑，操作截图如下：

Spark集群搭建与并验证环境是否搭建成功(三台机器)_scala_15

spark-env.sh配置成功后！

接下来配置spark的conf下slaves文件，把Worker节点都添加进去，顺序执行操作截图如下：

Spark集群搭建与并验证环境是否搭建成功(三台机器)_scala_16

上述是对于master节点的spark配置，关于slave1与slave2节点的操作截图如下：

Spark集群搭建与并验证环境是否搭建成功(三台机器)_spark环境配置_17

Spark集群搭建与并验证环境是否搭建成功(三台机器)_spark_18

Spark集群搭建与并验证环境是否搭建成功(三台机器)_spark环境配置_19

Spark集群搭建与并验证环境是否搭建成功(三台机器)_Spark集群搭建_20

Spark集群搭建与并验证环境是否搭建成功(三台机器)_scala_21

Spark集群搭建与并验证环境是否搭建成功(三台机器)_scala_22

3.启动并查看集群状况

在master节点上执行命令启动hadoop服务，启动之后，执行jps查看进程，三台机器截图如下：

Spark集群搭建与并验证环境是否搭建成功(三台机器)_spark环境配置_23

hadoop启动成功后，在master节点上，进入到spark的sbin目录下，执行命令：./start-all.sh

Spark集群搭建与并验证环境是否搭建成功(三台机器)_Spark集群搭建_24

会在主节点看到Master与Worker进程，在slave1与slave2看到worker进程！进入到spark集群的文本界面，访问：http://master:8080，看到三个worker，截图如下：

Spark集群搭建与并验证环境是否搭建成功(三台机器)_Spark集群搭建_25

进入spark-shell，然后在http://master:4040，截图如下：

Spark集群搭建与并验证环境是否搭建成功(三台机器)_大数据_26

Spark集群搭建与并验证环境是否搭建成功(三台机器)_Spark集群搭建_27

Spark集群搭建与并验证环境是否搭建成功(三台机器)_Spark集群搭建_28

Spark集群搭建与并验证环境是否搭建成功(三台机器)_大数据_29

赞
收藏
评论
分享
举报

上一篇：MediaWiki在Windows安装部署——配置phpMyAdmin

下一篇：对VirtualBox上的BT5虚拟机进行系统汉化步骤

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册