ホームページ >バックエンド開発 >Python チュートリアル >为什么这个网页的源代码用python爬下来后用beautifulsoup解析后会出现字符丢失?
<code class="language-text"> # -*- coding: utf-8 -*-
</code>
你是python2 代码前 加上# coding:utf-8<code class="language-text"> ur = res.contents[0]
ur = list(ur)
ur = ur[:-1]
temp = unicode(ur[0])
for index in range(0, len(ur), 4):
temp = unicode(ur[index])
print temp.strip()
print ur[index+1].string
print ur[index+1]['href']
print '\n'
</code>
似乎response 后面用了俩decode 后面一个改encode应该就好了吧。。。