>  Q&A  >  본문

python3 中文乱码

from bs4 import BeautifulSoup
from bs4 import UnicodeDammit
import requests

def run():
    soup = requests.get('http://zy.upln.cn/gongshi2014/index.html').text
    soup = BeautifulSoup(soup,'html.parser')
    soup = soup.find('tbody')
    for x in soup.find_all('tr'):
        for y in x.find_all('td'):
            s = y.a.text
            print(s)

if __name__=="__main__":
    run()

读取之后的内容不知道是不是gbk被当成UTF-8来处理了
求教

PHP中文网PHP中文网2741일 전378

모든 응답(2)나는 대답할 것이다

  • PHPz

    PHPz2017-04-17 17:36:23

    개인적인 제안은 응답을 받을 때 응답에 지정된 인코딩 형식에 따라 문자열을 구문 분석하는 것입니다

    으아악

    출력

    으아악

    회신하다
    0
  • 天蓬老师

    天蓬老师2017-04-17 17:36:23

    안녕하세요! 나도 비슷한 문제에 직면했습니다.
    해결책은 print(s)를 print(s.encode('latin1').decode('utf-8'))로 변경하는 것입니다.
    실행 결과는 다음과 같습니다.

    행운을 빕니다!

    회신하다
    0
  • 취소회신하다