Home  >  Q&A  >  body text

python2.7字符编码:首先decode('utf-8)然后保存的时候又encode('utf-8)有没有必要?

想请教一下python2.7下字符编码的两个问题。

python2.7爬虫爬取一个utf-8的中文网页,为了对防止乱码首先decode('utf-8')转化为unicode。然后如果将这些unicode编码的内容保存到文件的时候有调用encode('utf-8')以utf-8编码保存有没有必要?


# -*-coding:utf-8 -*-的作用是不是保存当前.py文件为utf-8编码?


高洛峰高洛峰2919 days ago920

reply all(1)I'll reply

  • 三叔

    三叔2016-10-22 15:50:59

    1.有必要

    decode('utf-8')的作用是将utf8编码的字符串解码为unicode,而unicode是python最接受的字符串编码格式,不会因为各个工具库对字符编码处理不好而带来问题。

    1.png

    2.是的

    coding:utf-8的作用是指定当前这个python代码文件里面所有字符串的编码


    reply
    0
  • Cancelreply