Aimmon的博客_Spark_51CTO博客

鸿蒙开发者社区

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册

# Spark

Spark学习笔记1. 伪分布式&全分布式环境搭建

Spark学习笔记1. 伪分布式&全分布式环境搭建

安装Linux、JDK等等解压：tar -zxvf spark-2.1.0-bin-hadoop2.7.tgz -C ~/training/由于Spark的脚本命令和Hadoop有冲突，只设置一个即可（不

spark

全分布式

伪分布式

环境搭建

hadoop

原创 10月前 49 阅读

Spark学习笔记2. HA 环境搭建

Spark学习笔记2. HA 环境搭建

Spark HA：两种方式参考讲义（1）基于文件目录：开发测试（单机环境）（*）将Worker和Applicatio

spark

HA

spark

hadoop

apache

原创 10月前 28 阅读

Spark学习笔记4. IDEA开发WordCount 程序

1.Scala 版package demoimport org.apache.spark.{SparkConf, SparkContext}object SparkDemo { def main(args: Array[String]): Uew SparkConf() sparkConf.se...

spark

scala

jar

wordcount

java

原创 10月前 26 阅读

Spark学习笔记5. WordCount处理流程

Spark学习笔记5. WordCount处理流程

spark

wordcount

翻译 10月前 34 阅读

Spark 学习笔记3. spark-submit + spark-shell

Spark 学习笔记3. spark-submit + spark-shell

spark-submit: 相当于 hadoop jar 命令 ---> 提交MapReduce任务（jar文件）提交Spark的任务（jar文件） Spark提

spark-submit

spark-shell

spark

scala

hdfs

原创 10月前 57 阅读

Spark学习笔记6. Spark提交任务的流程

Spark学习笔记6. Spark提交任务的流程

spark

提交任务的原理

翻译 10月前 60 阅读

Spark core 编程案例1

Spark core 编程案例1

测试数据:192.168.88.1 - - [30/Jul/2017:12:53:43 +0800] "GET /MyDemoWeb/ HTTP/1.1" 200 259192.168.200 713192.168.88.1 - - [30/J...

spark

spark core

非序列化对象

HTTP

原创 10月前 19 阅读

Spark coalesce 和repartitions 区别

源码包: org.apache.spark.rdddef coalesce(numPartitions: Int, shuffle: Boolean = false, partitionCoalescer: Option[PartitionCoale

spark

coalesce

repartition

并行度

ci

原创 10月前 59 阅读

scala > spark format jdbc java.sql.SQLException: No suitable driver

scala > spark format jdbc java.sql.SQLException: No suitable driver

scala> val jd = spark.read.format("jdbc").option("url","jdbc:oracle:thin:@192.168.163.134:1521:orcl").option("dn("user","scott").option("password&

scala

format jdbc

bc

spark

原创 10月前 85 阅读

SparkStreaming foreachRDD 算子

import java.sql.DriverManagerimport org.apache.spark.streaming.{Seconds, StreamingContext}import org.apache.spark.{SparkConf

sparkstreaming

foreachRDD

spark

sql

bc

原创 10月前 23 阅读

Spark shell The specified datastore driver (“com.mysql.jdbc.Driver“) was not found in the CLASSPATH

org.datanucleus.store.rdbms.connectionpool.DatastoreDriverNotFoundException: The specified datastore driver ("com.my

spark shell

the specified

datastore driv

spark

java

原创 10月前 79 阅读

Spark shuffle 调优

Shuffle参数调优spark.shuffle.file.buffer 默认值：32k 参数说明：该参数用于设置shuffle write task的BufferedOutputStream的

spark

shuffle

shuffle调优

调优

参数说明

原创 10月前 44 阅读

欢迎