python2.7字符编码：首先decode('utf-8)然后保存的时候又encode('utf-8)有没有必要?

Question

想请教一下python2.7下字符编码的两个问题。python2.7爬虫爬取一个utf-8的中文网页，为了对防止乱码首先decode('utf-8')转化为unicode。然后如果将这些unicode编码的内容保存到文件的时候有调用encode('utf-8')以utf-8编码保存有没有必要？# -*-coding:utf-8 -*-的作用是不是保存当前.py文件为

三叔 · Answer

1.有必要

decode('utf-8')的作用是将utf8编码的字符串解码为unicode，而unicode是python最接受的字符串编码格式，不会因为各个工具库对字符编码处理不好而带来问题。

2.是的

coding:utf-8的作用是指定当前这个python代码文件里面所有字符串的编码

python2.7字符编码：首先decode('utf-8)然后保存的时候又encode('utf-8)有没有必要?

reply all(1)I'll reply