spark单机和集群优缺点

转载

mob6454cc7aaa9d 2024-09-13 20:30:32

文章标签 spark单机和集群优缺点 spark scala java 文章分类 Spark 大数据

spark单机和集群优缺点_scala

一安装前说明
二安装配置所需的安装包

scala2104httppanbaiducoms1eSn2jsQ
Intellij IDE 20163 httppanbaiducoms1dFA4Pk1
spark 140 httppanbaiducoms1bLQcY6

三 windows7 安装 scala
四Intellij IDE 安装
五 Intellij IDE 中 scala 插件安装
六运行wordcount

一.安装前说明

1.台式机系统为windows7
2.此系统已安装和配置java
3.所有软件均为64位

二.安装配置所需的安装包

1.scala2.10.4（http://pan.baidu.com/s/1eSn2jsQ）

2.Intellij IDE 2016.3 (http://pan.baidu.com/s/1dFA4Pk1)

3.spark 1.4.0 （http://pan.baidu.com/s/1bLQcY6）

三. windows7 安装 scala

scala 安装比较容易，直接下载相应的安装包即可，因为Scala 2.10.3 版本比较稳定，我们推荐用它。

1.安装过程比较简单（如下图）：只需一路 next 即可。（安装位置自定义）

spark单机和集群优缺点_scala_02

四.Intellij IDE 安装

Intellij IDE 是常用的 java 编辑器，也可以作为 spark 单机版的调试器。Intellij IDE 有社区版和免费版，我们只需使用免费版即可。我们使用的是 2016.3 版本

1.安装过程很简单，如下图，一路 next 即可。（安装位置自定义）

spark单机和集群优缺点_spark单机和集群优缺点_03

五. Intellij IDE 中 scala 插件安装

1.启动 Intellij IDE，界面很炫酷

spark单机和集群优缺点_java_04

2.选择新建工程 Create New Project

spark单机和集群优缺点_java_05

这时（如下图）我们会发现没有 scala 插件

spark单机和集群优缺点_spark_06

3.安装 scala 插件

1.打开 File 中的 setting

spark单机和集群优缺点_java_07

2.点击 plugins 在搜索框里搜索 scala ，然后会看到 scala，点击 Install 安装，安装好之后重启即可。

spark单机和集群优缺点_scala_08

六.运行wordcount

1.新建工程，选择 scala。

spark单机和集群优缺点_spark单机和集群优缺点_09

2.新建 project name，sdk 选择 jdk 中的 java 1.8，scala jdk 选择 scala-sdk-2.10.4.

spark单机和集群优缺点_scala_10

spark单机和集群优缺点_java_11

3.选择 This windows

spark单机和集群优缺点_spark单机和集群优缺点_12

spark单机和集群优缺点_java_13

此处要等待一些时间。

spark单机和集群优缺点_scala_14

4.导入 spark jar 包

在file 中选择 project structure：点击 + ，选择 java，然后找到spark 包的存放路径，将lib 加入。

spark单机和集群优缺点_spark_15

点击ok

spark单机和集群优缺点_spark_16

此时可以在工程中看到lib包

spark单机和集群优缺点_java_17

5.src 新建包

spark单机和集群优缺点_java_18

spark单机和集群优缺点_spark单机和集群优缺点_19

6.在包中新建 scala 类（选择 object）

spark单机和集群优缺点_spark单机和集群优缺点_20

7.写入 wordcount 代码

spark单机和集群优缺点_java_21

package com.bigdata.zhaolei

import org.apache.spark.{SparkConf, SparkContext}

/**
  * Created by Administrator on 2016/11/12.
  */
class countword {
  def main(args: Array[String]): Unit ={
    val conf = new SparkConf().setMaster("local").setAppName("Wordcount")
    val sc = new SparkContext(conf)
    val data = sc.textFile("C://Users//Administrator//Desktop//word//wd.txt") // 文本存放的位置
    data.flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).collect().foreach(println)
}

8.测试代码运行结果

右键，点击 run wordcount（代码中设定的名字）

spark单机和集群优缺点_scala_22

OK,安装成功。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：Hadoop的distcp api调用示例

下一篇：python画11通道信号图

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯