from bs4 import BeautifulSoup
from bs4 import UnicodeDammit
import requests
def run():
soup = requests.get('http://zy.upln.cn/gongshi2014/index.html').text
soup = BeautifulSoup(soup,'html.parser')
soup = soup.find('tbody')
for x in soup.find_all('tr'):
for y in x.find_all('td'):
s = y.a.text
print(s)
if __name__=="__main__":
run()
读取之后的内容不知道是不是gbk被当成UTF-8来处理了
求教
天蓬老师2017-04-17 17:36:23
안녕하세요! 나도 비슷한 문제에 직면했습니다.
해결책은 print(s)를 print(s.encode('latin1').decode('utf-8'))로 변경하는 것입니다.
실행 결과는 다음과 같습니다.
행운을 빕니다!