Spark-Submit을 사용할 때 Spark 작업에 JAR 파일을 추가하는 몇 가지 옵션이 있습니다. 클래스 경로, 파일 배포 및 우선 순위에 대한 고유한 영향을 미칩니다.
Spark-Submit은 다음 옵션을 통해 ClassPath에 영향을 줍니다.
포함할 파일의 경우 두 ClassPath 모두에서 both 플래그에 지정해야 합니다.
파일 배포는 실행 모드에 따라 다릅니다.
Spark-Submit은 파일 배포를 위해 다음 URI 접두사를 지원합니다.
질문에 언급된 옵션은 다음과 같이 JAR 파일 처리에 영향을 미칩니다.
SparkConf에 직접 설정된 속성의 우선순위가 가장 높고 Spark-Submit 플래그와 Spark-defaults.conf의 옵션이 그 뒤를 따릅니다. 따라서 코드에 설정된 모든 값은 해당 플래그나 옵션을 재정의합니다.
클라이언트 모드에서는 세 가지 주요 옵션을 모두 사용하여 JAR 파일을 추가하는 것이 안전합니다.
spark-submit --jars additional1.jar,additional2.jar \ --driver-class-path additional1.jar:additional2.jar \ --conf spark.executor.extraClassPath=additional1.jar:additional2.jar \ --class MyClass main-application.jar
단, 클러스터 모드에서는 --jars를 사용하여 파일을 추가하고, 작업자 노드에 직접 수동으로 배포해야 합니다. --driver-library-path에 JAR 파일을 전달하는 것과 같은 중복 인수는 피해야 합니다.
위 내용은 Spark-Submit을 사용하여 Spark 작업에 JAR 파일을 추가하는 방법은 무엇이며, 이를 위한 다양한 옵션과 고려 사항은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!