搜索
首页Javajava教程如何使用 Spark-Submit 将 JAR 文件添加到 Spark 作业以及类路径如何工作?

How do I Add JAR Files to a Spark Job with Spark-Submit and How Does the Classpath Work?

使用 Spark-Submit 将 JAR 文件添加到 Spark 作业

ClassPath 效果

使用extraClassPath 或 --driver-class-path 设置驱动程序节点的类路径,而spark.executor.extraClassPath 设置工作节点的类路径。要让 JAR 影响两者,请在两种配置中指定它。

分隔符

使用的分隔符取决于操作系统:

  • Linux: 冒号 (:)
  • Windows: 分号 (;)

文件分发

在客户端模式下,文件通过以下方式分发HTTP 服务器。在集群模式下,必须通过 HDFS 或其他共享存储向工作人员提供它们。

URI 类型

接受的 URL 方案包括:

  • file: - 由驱动程序的 HTTP 服务器提供
  • hdfs:, http:, https:, ftp: - 直接获取文件
  • local: - 假设每个工作节点上都存在文件

受影响的选项

  • --jars(或 SparkContext.addJar): 添加 JAR 而不修改类路径。
  • --conf spark.driver.extraClassPath: 将 JAR 添加到驱动程序类路径。
  • --conf spark.driver.extraLibraryPath: 添加到外部的路径驱动程序的库。
  • --conf spark.executor.extraClassPath: 将 JAR 添加到工作器类路径。
  • --conf spark.executor.extraLibraryPath : 为工作人员添加外部库的路径。

优先级

直接在 SparkConf 上设置的值优先于标志或 Spark 提交选项。

简单起见

在客户端模式下,可以使用以下内容为驱动程序和工作人员添加 JAR:

spark-submit --jars additional1.jar,additional2.jar \
  --driver-class-path additional1.jar:additional2.jar \
  --conf spark.executor.extraClassPath=additional1.jar:additional2.jar \
  --class MyClass main-application.jar

在集群模式下但是,请确保可通过共享存储系统访问 JAR。

以上是如何使用 Spark-Submit 将 JAR 文件添加到 Spark 作业以及类路径如何工作?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
如何将Maven或Gradle用于高级Java项目管理,构建自动化和依赖性解决方案?如何将Maven或Gradle用于高级Java项目管理,构建自动化和依赖性解决方案?Mar 17, 2025 pm 05:46 PM

本文讨论了使用Maven和Gradle进行Java项目管理,构建自动化和依赖性解决方案,以比较其方法和优化策略。

如何使用适当的版本控制和依赖项管理创建和使用自定义Java库(JAR文件)?如何使用适当的版本控制和依赖项管理创建和使用自定义Java库(JAR文件)?Mar 17, 2025 pm 05:45 PM

本文使用Maven和Gradle之类的工具讨论了具有适当的版本控制和依赖关系管理的自定义Java库(JAR文件)的创建和使用。

如何使用咖啡因或Guava Cache等库在Java应用程序中实现多层缓存?如何使用咖啡因或Guava Cache等库在Java应用程序中实现多层缓存?Mar 17, 2025 pm 05:44 PM

本文讨论了使用咖啡因和Guava缓存在Java中实施多层缓存以提高应用程序性能。它涵盖设置,集成和绩效优势,以及配置和驱逐政策管理最佳PRA

如何将JPA(Java持久性API)用于具有高级功能(例如缓存和懒惰加载)的对象相关映射?如何将JPA(Java持久性API)用于具有高级功能(例如缓存和懒惰加载)的对象相关映射?Mar 17, 2025 pm 05:43 PM

本文讨论了使用JPA进行对象相关映射,并具有高级功能,例如缓存和懒惰加载。它涵盖了设置,实体映射和优化性能的最佳实践,同时突出潜在的陷阱。[159个字符]

Java的类负载机制如何起作用,包括不同的类载荷及其委托模型?Java的类负载机制如何起作用,包括不同的类载荷及其委托模型?Mar 17, 2025 pm 05:35 PM

Java的类上载涉及使用带有引导,扩展程序和应用程序类负载器的分层系统加载,链接和初始化类。父代授权模型确保首先加载核心类别,从而影响自定义类LOA

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
1 个月前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
1 个月前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
1 个月前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.聊天命令以及如何使用它们
1 个月前By尊渡假赌尊渡假赌尊渡假赌

热工具

MinGW - 适用于 Windows 的极简 GNU

MinGW - 适用于 Windows 的极简 GNU

这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

EditPlus 中文破解版

EditPlus 中文破解版

体积小,语法高亮,不支持代码提示功能

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境