Maison  >  Article  >  développement back-end  >  Utilisez Python pour obtenir le code d'implémentation de la méthode de codage de page Web

Utilisez Python pour obtenir le code d'implémentation de la méthode de codage de page Web

高洛峰
高洛峰original
2017-03-13 09:41:071645parcourir

Cet article présente principalement les informations pertinentes sur l'utilisation de python pour obtenir le code d'implémentation de la méthode d'encodage de page Web. Les amis dans le besoin peuvent se référer à

python pour obtenir la page Web. code d'implémentation de la méthode d'encodage


<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
   </span><span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
python开发,自动化获取网页编码方式用到了chardet库,字符集检测,这个类在python2.7中没有,需要在官网上下载。
这里我下载好了chardet-2.3.0.tar.gz压缩包文件,只需要将压缩包文件解压后的chardet文件放到python安装包下的
python27/lib/site-packages/下,就可以了。</span>

Puis importez chardet

et ci-dessous j'ai écrit une fonction de détection automatisée pour détecter les connexions URL, puis renvoie la méthode de codage de l'URL de la page Web.


import chardet #字符集检测 
import urllib 
 
url="http://www.jd.com" 
 
 
def automatic_detect(url): 
  content=urllib.urlopen(url).read() 
  result=chardet.detect(content) 
 
  encoding=result[&#39;encoding&#39;] 
 
  return encoding 
 
urls=[&#39;http://www.baidu.com&#39;,&#39;http://www.163.com&#39;,&#39;http://dangdang.com&#39;] 
for url in urls: 
  print url,automatic_detect(url)

Ce qui précède utilise la méthode de détection de la classe chardet, renvoie le dictionnaire, puis supprime la méthode d'encodage encoding

Merci d'avoir lu, j'espère que cela vous aidera. À tous, merci pour votre soutien à ce site !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn