PyFlink作业在YARN上提交失败:Python脚本缺失原因分析及解决方法
使用YARN提交PyFlink作业时,可能会遇到找不到Python脚本的错误,例如:
<code>2024-05-24 16:38:02,030 info org.apache.flink.client.python.pythondriver [] - pyflink181.zip/pyflink181/bin/python: can't open file 'hdfs://nameservice1/pyflink/wc2.py': [errno 2] no such file or directory</code>
这通常发生在使用以下类似命令时:
./flink run-application -t yarn-application \ -dyarn.application.name=flinkcdctestpython \ -dyarn.provided.lib.dirs="hdfs://nameservice1/pyflink/flink-dist-181" \ -pyarch hdfs://nameservice1/pyflink/pyflink181.zip \ -pyclientexec pyflink181.zip/pyflink181/bin/python \ -pyexec pyflink181.zip/pyflink181/bin/python \ -py hdfs://nameservice1/pyflink/wc2.py
与之对比,Java作业提交则通常不会出现问题:
./flink run-application -t yarn-application \ -djobmanager.memory.process.size=1024m \ -dtaskmanager.memory.process.size=1024m \ -dyarn.application.name=flinkcdctest \ -dyarn.provided.lib.dirs="hdfs://nameservice1/pyflink/flink-dist-181" \ hdfs://nameservice1/pyflink/statemachineexample.jar
Java作业成功提交,说明HDFS配置正确,问题在于PyFlink作业的Python脚本路径或配置。
排查及解决步骤
-
验证Python脚本路径: 使用
hdfs dfs -ls hdfs://nameservice1/pyflink/wc2.py
命令检查脚本wc2.py
是否存在于指定的HDFS路径。如果不存在,请确保正确上传脚本到该路径。 -
检查PyFlink配置: 仔细检查
-pyarch
、-pyclientexec
和-pyexec
参数,确保它们准确指向PyFlink环境和Python解释器。pyflink181.zip
必须包含所有必要的Python库和执行环境。 -
权限问题: 使用
hdfs dfs -ls -h hdfs://nameservice1/pyflink/wc2.py
查看脚本的HDFS权限。 如果权限不足,使用hdfs dfs -chmod 755 hdfs://nameservice1/pyflink/wc2.py
修改权限,确保YARN和Flink用户拥有读取权限。 -
日志分析: 启用Flink和YARN的详细日志记录,分析错误日志以获取更具体的错误信息和发生位置。
-
Python环境兼容性: 确保PyFlink使用的Python版本与开发脚本时使用的版本一致,避免版本不兼容导致脚本无法识别或执行。
通过以上步骤,系统地排查问题,并根据实际情况调整配置,即可解决PyFlink作业在YARN上提交时找不到Python脚本的问题。 如果问题仍然存在,请提供更详细的Flink和YARN日志信息以便进一步分析。
以上是在YARN上提交PyFlink作业时,为什么会报错无法找到Python脚本?的详细内容。更多信息请关注PHP中文网其他相关文章!

在使用IntelliJIDEAUltimate版本启动Spring...

在使用MyBatis-Plus或其他ORM框架进行数据库操作时,经常需要根据实体类的属性名构造查询条件。如果每次都手动...

Redis缓存方案如何实现产品排行榜列表的需求?在开发过程中,我们常常需要处理排行榜的需求,例如展示一个�...

将姓名转换为数字以实现排序的解决方案在许多应用场景中,用户可能需要在群组中进行排序,尤其是在一个用...

电商平台SKU和SPU表设计详解本文将探讨电商平台中SKU和SPU的数据库设计问题,特别是如何处理用户自定义销售属...

在Idea中如何设置SpringBoot项目默认运行配置列表在使用IntelliJ...


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

mPDF
mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

SecLists
SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

WebStorm Mac版
好用的JavaScript开发工具

DVWA
Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

禅工作室 13.0.1
功能强大的PHP集成开发环境