Maison  >  Questions et réponses  >  le corps du texte

python2.7字符编码:首先decode('utf-8)然后保存的时候又encode('utf-8)有没有必要?

想请教一下python2.7下字符编码的两个问题。

python2.7爬虫爬取一个utf-8的中文网页,为了对防止乱码首先decode('utf-8')转化为unicode。然后如果将这些unicode编码的内容保存到文件的时候有调用encode('utf-8')以utf-8编码保存有没有必要?


# -*-coding:utf-8 -*-的作用是不是保存当前.py文件为utf-8编码?


高洛峰高洛峰2919 Il y a quelques jours921

répondre à tous(1)je répondrai

  • 三叔

    三叔2016-10-22 15:50:59

    1.有必要

    decode('utf-8')的作用是将utf8编码的字符串解码为unicode,而unicode是python最接受的字符串编码格式,不会因为各个工具库对字符编码处理不好而带来问题。

    1.png

    2.是的

    coding:utf-8的作用是指定当前这个python代码文件里面所有字符串的编码


    répondre
    0
  • Annulerrépondre