ホームページ  >  記事  >  バックエンド開発  >  Python を使用して Web ページのエンコーディング メソッドの実装コードを取得する

Python を使用して Web ページのエンコーディング メソッドの実装コードを取得する

高洛峰
高洛峰オリジナル
2017-03-13 09:41:071641ブラウズ

この記事では、主に python を使用してコードを実装するための Web ページのエンコード メソッドを取得することに関する関連情報を紹介します。必要な場合は、

Python を参照して、コードを実装する Web ページのエンコード メソッドを取得できます。

<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
   </span><span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
python开发,自动化获取网页编码方式用到了chardet库,字符集检测,这个类在python2.7中没有,需要在官网上下载。
这里我下载好了chardet-2.3.0.tar.gz压缩包文件,只需要将压缩包文件解压后的chardet文件放到python安装包下的
python27/lib/site-packages/下,就可以了。</span>

次に、chardet をインポートします

URL 接続を検出し、Web ページ URL のエンコード方法を返す自動検出
関数

を以下に記述します。


import chardet #字符集检测 
import urllib 
 
url="http://www.jd.com" 
 
 
def automatic_detect(url): 
  content=urllib.urlopen(url).read() 
  result=chardet.detect(content) 
 
  encoding=result[&#39;encoding&#39;] 
 
  return encoding 
 
urls=[&#39;http://www.baidu.com&#39;,&#39;http://www.163.com&#39;,&#39;http://dangdang.com&#39;] 
for url in urls: 
  print url,automatic_detect(url)

chardet クラスの detect メソッドが上記で使用され、辞書を返し、エンコード メソッド encoding を取り出します

読んでいただきありがとうございます。皆さんのお役に立てれば幸いです。サポートしていただきありがとうございますサイト!

以上がPython を使用して Web ページのエンコーディング メソッドの実装コードを取得するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。