PyFlink作業在YARN上提交失敗:Python腳本缺失原因分析及解決方法
使用YARN提交PyFlink作業時,可能會遇到找不到Python腳本的錯誤,例如:
<code>2024-05-24 16:38:02,030 info org.apache.flink.client.python.pythondriver [] - pyflink181.zip/pyflink181/bin/python: can't open file 'hdfs://nameservice1/pyflink/wc2.py': [errno 2] no such file or directory</code>
這通常發生在使用以下類似命令時:
./flink run-application -t yarn-application \ -dyarn.application.name=flinkcdctestpython \ -dyarn.provided.lib.dirs="hdfs://nameservice1/pyflink/flink-dist-181" \ -pyarch hdfs://nameservice1/pyflink/pyflink181.zip \ -pyclientexec pyflink181.zip/pyflink181/bin/python \ -pyexec pyflink181.zip/pyflink181/bin/python \ -py hdfs://nameservice1/pyflink/wc2.py
與之對比,Java作業提交則通常不會出現問題:
./flink run-application -t yarn-application \ -djobmanager.memory.process.size=1024m \ -dtaskmanager.memory.process.size=1024m \ -dyarn.application.name=flinkcdctest \ -dyarn.provided.lib.dirs="hdfs://nameservice1/pyflink/flink-dist-181" \ hdfs://nameservice1/pyflink/statemachineexample.jar
Java作業成功提交,說明HDFS配置正確,問題在於PyFlink作業的Python腳本路徑或配置。
排查及解決步驟
驗證Python腳本路徑:使用
hdfs dfs -ls hdfs://nameservice1/pyflink/wc2.py
命令檢查腳本wc2.py
是否存在於指定的HDFS路徑。如果不存在,請確保正確上傳腳本到該路徑。檢查PyFlink配置:仔細檢查
-pyarch
、-pyclientexec
和-pyexec
參數,確保它們準確指向PyFlink環境和Python解釋器。pyflink181.zip
必須包含所有必要的Python庫和執行環境。權限問題:使用
hdfs dfs -ls -h hdfs://nameservice1/pyflink/wc2.py
查看腳本的HDFS權限。 如果權限不足,使用hdfs dfs -chmod 755 hdfs://nameservice1/pyflink/wc2.py
修改權限,確保YARN和Flink用戶擁有讀取權限。日誌分析:啟用Flink和YARN的詳細日誌記錄,分析錯誤日誌以獲取更具體的錯誤信息和發生位置。
Python環境兼容性:確保PyFlink使用的Python版本與開發腳本時使用的版本一致,避免版本不兼容導致腳本無法識別或執行。
通過以上步驟,系統地排查問題,並根據實際情況調整配置,即可解決PyFlink作業在YARN上提交時找不到Python腳本的問題。 如果問題仍然存在,請提供更詳細的Flink和YARN日誌信息以便進一步分析。
以上是在YARN上提交PyFlink作業時,為什麼會報錯無法找到Python腳本?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

類加載器通過統一的類文件格式、動態加載、雙親委派模型和平台無關的字節碼,確保Java程序在不同平台上的一致性和兼容性,實現平台獨立性。

Java編譯器生成的代碼是平台無關的,但最終執行的代碼是平台特定的。 1.Java源代碼編譯成平台無關的字節碼。 2.JVM將字節碼轉換為特定平台的機器碼,確保跨平台運行但性能可能不同。

多線程在現代編程中重要,因為它能提高程序的響應性和資源利用率,並處理複雜的並發任務。 JVM通過線程映射、調度機制和同步鎖機制,在不同操作系統上確保多線程的一致性和高效性。

Java的平台獨立性是指編寫的代碼可以在任何安裝了JVM的平台上運行,無需修改。 1)Java源代碼編譯成字節碼,2)字節碼由JVM解釋執行,3)JVM提供內存管理和垃圾回收功能,確保程序在不同操作系統上運行。

Javaapplicationscanindeedencounterplatform-specificissuesdespitetheJVM'sabstraction.Reasonsinclude:1)Nativecodeandlibraries,2)Operatingsystemdifferences,3)JVMimplementationvariations,and4)Hardwaredependencies.Tomitigatethese,developersshould:1)Conduc

云计算显著提升了Java的平台独立性。1)Java代码编译为字节码,由JVM在不同操作系统上执行,确保跨平台运行。2)使用Docker和Kubernetes部署Java应用,提高可移植性和可扩展性。

Java'splatformindependenceallowsdeveloperstowritecodeonceandrunitonanydeviceorOSwithaJVM.Thisisachievedthroughcompilingtobytecode,whichtheJVMinterpretsorcompilesatruntime.ThisfeaturehassignificantlyboostedJava'sadoptionduetocross-platformdeployment,s

容器化技術如Docker增強而非替代Java的平台獨立性。 1)確保跨環境的一致性,2)管理依賴性,包括特定JVM版本,3)簡化部署過程,使Java應用更具適應性和易管理性。


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

SAP NetWeaver Server Adapter for Eclipse
將Eclipse與SAP NetWeaver應用伺服器整合。

ZendStudio 13.5.1 Mac
強大的PHP整合開發環境

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器

SublimeText3 Linux新版
SublimeText3 Linux最新版