IDEA开发scala版本的spark程序_scala

 

 

IDEA开发scala版本的spark程序_scala_02

 

 

package com.gong

import org.apache.spark.{SparkConf, SparkContext}

object MyScalaWorldCount {
def main(args: Array[String]): Unit = {
//参数检测
if(args.length<2){
System.err.println("Usage: MyScalaWorldCount <input> <output>")
System.exit(1)
}

//创建SparkContext
val conf = new SparkConf().setAppName("MyScalaWorldCount")
conf.setMaster("local[2]")
val sc = new SparkContext(conf)

//读取数据
val lines=sc.textFile(args(0))

//进行相关计算
val resultRDD = lines.flatMap(_.split("\\s+")).map((_,1)).reduceByKey(_+_)

//保存结果
resultRDD.saveAsTextFile(args(1))

sc.stop()
}
}

 

 

 

运行程序可以看到报错,因为没有传入输入输出路径

IDEA开发scala版本的spark程序_输入输出_03

 

 

 

 

传入参数

IDEA开发scala版本的spark程序_spark_04

 

 

 

IDEA开发scala版本的spark程序_输入输出_05

 

 

 

运行程序

IDEA开发scala版本的spark程序_spark_06

 

 

 

IDEA开发scala版本的spark程序_输入输出_07