搜索

首页  >  问答  >  正文

python - 使用`zipfile`模块在不解压缩的情况下如何使用text模式读取文本文件?

我使用的Python版本为3.5.2,尝试用zipfile模块的zipfile.ZipFile.open方法打开一个压缩包中的文本文件时,即使使用了文档中要求的rU参数,打开时仍然是以二进制数据格式打开的,百思不得其解。

代码:

>>> import zipfile
>>> zf = zipfile.ZipFile('/Users/chiqingjun/Downloads/top-1m.csv.zip')
>>> zf.namelist()
['top-1m.csv']
>>> f = zf.open(zf.namelist()[0], mode='rU')
>>> f
<zipfile.ZipExtFile name='top-1m.csv' mode='rU' compress_type=deflate>
>>> f.readline()
b'1,google.com\n'
# 仍然是二进制数据

官方文档(3.5.2版本):

给我你的怀抱给我你的怀抱2769 天前998

全部回复(2)我来回复

  • 巴扎黑

    巴扎黑2017-06-22 11:53:42

    其实最后输出的二进制, 和zipfile无关, 是和py3.5有关, 你可以在输出的结果解码, 就能得到字符类型了

    content = f.readline()
    print(content.decode('utf8'))

    回复
    0
  • 女神的闺蜜爱上我

    女神的闺蜜爱上我2017-06-22 11:53:42

    文档已经说了呀,rU通用换行符,并且将在3.6 移除此模式。

    压缩文件以二进制读取字节内容是应该的,后面如何转码由程序员决定。

    回复
    0
  • 取消回复