Spark深入解读（五）---- SparkStandalone模式集群部署和任务启动方式

原创

北京小辉 2022-12-28 15:16:23 ©著作权

©著作权归作者所有：来自51CTO博客作者北京小辉的原创作品，请联系作者获取转载授权，否则将追究法律责任

/usr/app/spark-2.3.3-bin-hadoop2.7/bin/spark-submit \
 --master local  \
 --deploy-mode client  \
 --num-executors 3  \
 --executor-memory 1g  \
 --executor-cores 1  \
 --jars /usr/app/apache-hive-2.3.1-bin/lib/mysql-connector-java-5.1.36-bin.jar  \
 --driver-class-path  /usr/app/apache-hive-2.3.1-bin/lib/mysql-connector-java-5.1.36-bin.jar  \
 /root/project/datawarehouse-1.0-SNAPSHOT-jar-with-dependencies.jar  \
 local[*]

yanr启动

/usr/app/spark-2.3.3-bin-hadoop2.7/bin/spark-submit \
 --master yarn  \
 --deploy-mode cluster  \
 --num-executors 3  \
 --executor-memory 1g  \
 --executor-cores 1  \
 --jars /usr/app/apache-hive-2.3.1-bin/lib/mysql-connector-java-5.1.36-bin.jar  \
 --driver-class-path  /usr/app/apache-hive-2.3.1-bin/lib/mysql-connector-java-5.1.36-bin.jar  \
 /root/project/datawarehouse-1.0-SNAPSHOT-jar-with-dependencies.jar  \
  yarn

在pom中加入打包插件

<build>
    <plugins>
        <!-- 指定编译java的插件 -->
        <plugin>
            <groupId>org.apache.maven.plugins</groupId>
            <artifactId>maven-compiler-plugin</artifactId>
            <version>3.5.1</version>
            <configuration>
                <source>1.8</source>
                <target>1.8</target>
            </configuration>
        </plugin>

        <!-- 指定编译scala的插件 -->
        <plugin>
            <groupId>net.alchim31.maven</groupId>
            <artifactId>scala-maven-plugin</artifactId>
            <version>3.2.2</version>
            <executions>
                <execution>
                    <goals>
                        <goal>compile</goal>
                        <goal>testCompile</goal>
                    </goals>
                    <configuration>
                        <args>
                            <arg>-dependencyfile</arg>
                            <arg>${project.build.directory}/.scala_dependencies</arg>
                        </args>
                    </configuration>
                </execution>
            </executions>
        </plugin>

        <!--  把依赖jar中的用到的类，提取到自己的jar中 -->
        <plugin>
            <groupId>org.apache.maven.plugins</groupId>
            <artifactId>maven-assembly-plugin</artifactId>
            <version>2.6</version>
            <configuration>
                <archive>
                    <manifest>
                        <mainClass>类名称路径</mainClass>
                    </manifest>
                </archive>
                <descriptorRefs>
                    <descriptorRef>jar-with-dependencies</descriptorRef>
                </descriptorRefs>
            </configuration>
            <!--下面是为了使用 mvn package命令，如果不加则使用mvn assembly-->
            <executions>
                <execution>
                    <id>make-assemble</id>
                    <phase>package</phase>
                    <goals>
                        <goal>single</goal>
                    </goals>
                </execution>
            </executions>
        </plugin>
    </plugins>
</build>