Python解析Socket数据流异常bytes的问题（详细）-Python教程-PHP中文网

首页

后端开发

Python教程

Python解析Socket数据流异常bytes的问题（详细）

不言

Mar 13, 2019 pm 01:26 PM

python

本篇文章给大家带来的内容是关于Python解析Socket数据流异常bytes的问题（详细），有一定的参考价值，有需要的朋友可以参考一下，希望对你有所帮助。

python在通过socket发送数据时，英文字符转义后为原来本身的字符，占一个字节（如：s转移后为s），而中文字符在转义后需要二个字节来标识一个中文字符（如：钟转义后为\x92\x9f）。在发送端是不存在问题的，而发生问题的主要是在socket客户端。因为客户端在接受数据流时，每次接受都是有字节限制，就会出现一个中文字符分两次接受，从而导致每次接受的流在转义成字符时报错UnicodeDecodeError。

当前有数据流：

bmsg = b&#39;\xe5\x88\x86\n\xe9\x92\x9f&#39; # 分\n钟

正常接受并转义为：

smsg = str(bmsg, &#39;utf-8&#39;)   #方式一 或 
smsg = bmsg.decode()  # 方式二 第一参数默认utf8，第二参数默认strict，还有 ignore （忽略）、 replace （替代=?）

如果现在接受到的数据流为

bmsg = b&#39;\xe5\x88\x86\n\xe9\x92&#39;    # \x9f 作为下次接受

如何避免程序的异常退出，有两种处理方式：
1）数据丢失处理
此时，如果再用正常接受方式转义bytes流，就会出现 UnicodeDecodeError 异常，为使不报异常，我们在转义时，通过方式二，指定第二个参数为 ignore，如下：

smsg = bmsg.decode(&#39;utf-8&#39;, &#39;ignore&#39;) # 输出： 分\n  ，如果为 replace 则 \n 后为 ?

2）数据流拆分，再处理
一般socket服务端在发送数据时，每个数据流是完整的，并会以特定的字符（如：\n）结束一并发送。根据这种现状，我们在每次接受数据时，根据这个特定字符拆分（split）为一个保存单个数据流的列表。列表的第一个流可能为不完整，把它和上次接受的流合并为一个完整的数据流并转义；中间为可以正常转义的数据流；最后一个流也为不完整，保存下来，用来拼接下次接受的流，并重复上述操作，这样保障了程序不会异常退出，也保障数据的完整性。大致代码如下：
数据接受情况：

第一次接受 msg1 = b'\xe5\x88\x86\n\xe9' ； # 钟被拆分成 \xe9 和 \x92\x9f
第二次接受 msg2 = b'\x92\x9f_stone\n'

init_msg = b&#39;&#39; # 初始化流
　　while True:
　　　　msg = soc.recv(128) # 接受数据
　　　　init_msg += msg
　　　　msg_arr = init_msg.split(b&#39;\n&#39;) # 注意此处的 b&#39;\n&#39; ，因为被拆分的为bytes串，所以也要用bytes串来拆分
　　　　init_msg += msg_arr[-1]
　　　　msg_arr.remove(msg_arr[-1])
　　　　for i in range(len(msg_arr)):
　　　　　　string = msg_arr[i].decode(&#39;utf-8&#39;)
　　　　　　print(string

以上是Python解析Socket数据流异常bytes的问题（详细）的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文转载于：博客园。如有侵权，请联系admin@php.cn删除

Python vs.C：申请和用例Apr 12, 2025 am 12:01 AM

Python适合数据科学、Web开发和自动化任务，而C 适用于系统编程、游戏开发和嵌入式系统。 Python以简洁和强大的生态系统着称，C 则以高性能和底层控制能力闻名。

2小时的Python计划：一种现实的方法Apr 11, 2025 am 12:04 AM

2小时内可以学会Python的基本编程概念和技能。1.学习变量和数据类型，2.掌握控制流（条件语句和循环），3.理解函数的定义和使用，4.通过简单示例和代码片段快速上手Python编程。

Python：探索其主要应用程序Apr 10, 2025 am 09:41 AM

Python在web开发、数据科学、机器学习、自动化和脚本编写等领域有广泛应用。1)在web开发中，Django和Flask框架简化了开发过程。2)数据科学和机器学习领域，NumPy、Pandas、Scikit-learn和TensorFlow库提供了强大支持。3)自动化和脚本编写方面，Python适用于自动化测试和系统管理等任务。