from bs4 import BeautifulSoup
from bs4 import UnicodeDammit
import requests
def run():
soup = requests.get('http://zy.upln.cn/gongshi2014/index.html').text
soup = BeautifulSoup(soup,'html.parser')
soup = soup.find('tbody')
for x in soup.find_all('tr'):
for y in x.find_all('td'):
s = y.a.text
print(s)
if __name__=="__main__":
run()
读取之后的内容不知道是不是gbk被当成UTF-8来处理了
求教
天蓬老师2017-04-17 17:36:23
こんにちは!私も同様の問題に遭遇したことがあります。
解決策は、print(s) を print(s.encode('latin1').decode('utf-8')) に変更することです。
これは実行結果です:
頑張ってください!