ホームページ >バックエンド開発 >Python チュートリアル >Python処理中国語エンコードと判定エンコード例

Python処理中国語エンコードと判定エンコード例

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBオリジナル: 2016-06-16 08:45:041174ブラウズ

以下はすべて Python2.7 用です

コードをコピーコードは次のとおりです:

#coding:utf-8
#chardet をダウンロードする必要がありますそしてインストールされました

import chardet
#Catch webpage html
line = "http://www.***.com"
html_1 = urllib2.urlopen(line,timeout=120).read()
#print html_1
encoding_dict = chardet.detect(html_1)
#print encoding
web_encoding = encoding_dict['encoding']
if web_encoding == 'utf-8' または web_encoding == ' UTF-8':

html = html_1
else :
html = html_1.decode('gbk','ignore').encode('utf-8')

#上記の処理により、html全体が文字化けすることはありません。

声明：

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

前の記事：ブログ記事クローラーの Python 実装例次の記事：ブログ記事クローラーの Python 実装例

続きを見る

Python処理中国語エンコードと判定エンコード例

関連記事