使用 Spark-Submit 将 JAR 文件添加到 Spark 作业
ClassPath 效果
使用extraClassPath 或 --driver-class-path 设置驱动程序节点的类路径,而spark.executor.extraClassPath 设置工作节点的类路径。要让 JAR 影响两者,请在两种配置中指定它。
分隔符
使用的分隔符取决于操作系统:
- Linux: 冒号 (:)
- Windows: 分号 (;)
文件分发
在客户端模式下,文件通过以下方式分发HTTP 服务器。在集群模式下,必须通过 HDFS 或其他共享存储向工作人员提供它们。
URI 类型
接受的 URL 方案包括:
- file: - 由驱动程序的 HTTP 服务器提供
- hdfs:, http:, https:, ftp: - 直接获取文件
- local: - 假设每个工作节点上都存在文件
受影响的选项
- --jars(或 SparkContext.addJar): 添加 JAR 而不修改类路径。
- --conf spark.driver.extraClassPath: 将 JAR 添加到驱动程序类路径。
- --conf spark.driver.extraLibraryPath: 添加到外部的路径驱动程序的库。
- --conf spark.executor.extraClassPath: 将 JAR 添加到工作器类路径。
- --conf spark.executor.extraLibraryPath : 为工作人员添加外部库的路径。
优先级
直接在 SparkConf 上设置的值优先于标志或 Spark 提交选项。
简单起见
在客户端模式下,可以使用以下内容为驱动程序和工作人员添加 JAR:
spark-submit --jars additional1.jar,additional2.jar \ --driver-class-path additional1.jar:additional2.jar \ --conf spark.executor.extraClassPath=additional1.jar:additional2.jar \ --class MyClass main-application.jar
在集群模式下但是,请确保可通过共享存储系统访问 JAR。
以上是如何使用 Spark-Submit 将 JAR 文件添加到 Spark 作业以及类路径如何工作?的详细内容。更多信息请关注PHP中文网其他相关文章!

本文讨论了使用Maven和Gradle进行Java项目管理,构建自动化和依赖性解决方案,以比较其方法和优化策略。

本文使用Maven和Gradle之类的工具讨论了具有适当的版本控制和依赖关系管理的自定义Java库(JAR文件)的创建和使用。

本文讨论了使用咖啡因和Guava缓存在Java中实施多层缓存以提高应用程序性能。它涵盖设置,集成和绩效优势,以及配置和驱逐政策管理最佳PRA

本文讨论了使用JPA进行对象相关映射,并具有高级功能,例如缓存和懒惰加载。它涵盖了设置,实体映射和优化性能的最佳实践,同时突出潜在的陷阱。[159个字符]

Java的类上载涉及使用带有引导,扩展程序和应用程序类负载器的分层系统加载,链接和初始化类。父代授权模型确保首先加载核心类别,从而影响自定义类LOA


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

MinGW - 适用于 Windows 的极简 GNU
这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

EditPlus 中文破解版
体积小,语法高亮,不支持代码提示功能

SublimeText3汉化版
中文版,非常好用

SublimeText3 Linux新版
SublimeText3 Linux最新版

禅工作室 13.0.1
功能强大的PHP集成开发环境