検索

ホームページ  >  に質問  >  本文

python3 中文乱码

from bs4 import BeautifulSoup
from bs4 import UnicodeDammit
import requests

def run():
    soup = requests.get('http://zy.upln.cn/gongshi2014/index.html').text
    soup = BeautifulSoup(soup,'html.parser')
    soup = soup.find('tbody')
    for x in soup.find_all('tr'):
        for y in x.find_all('td'):
            s = y.a.text
            print(s)

if __name__=="__main__":
    run()

读取之后的内容不知道是不是gbk被当成UTF-8来处理了
求教

PHP中文网PHP中文网2811日前399

全員に返信(2)返信します

  • PHPz

    PHPz2017-04-17 17:36:23

    私の個人的な提案は、応答を取得するときに、応答で指定されたエンコード形式に従って文字列を解析することです

    リーリー

    出力

    リーリー

    返事
    0
  • 天蓬老师

    天蓬老师2017-04-17 17:36:23

    こんにちは!私も同様の問題に遭遇したことがあります。
    解決策は、print(s) を print(s.encode('latin1').decode('utf-8')) に変更することです。
    これは実行結果です:

    頑張ってください!

    返事
    0
  • キャンセル返事