Heim  >  Artikel  >  Backend-Entwicklung  >  Verwenden Sie Python, um den Implementierungscode für die Webseitenkodierungsmethode abzurufen

Verwenden Sie Python, um den Implementierungscode für die Webseitenkodierungsmethode abzurufen

高洛峰
高洛峰Original
2017-03-13 09:41:071650Durchsuche

In diesem Artikel werden hauptsächlich relevante Informationen zur Verwendung von Python zum Erhalten des Implementierungscodes für die Webseitenkodierungsmethode vorgestellt. Freunde in Not können sich auf

Python beziehen, um die Webseite zu erhalten Codierungsmethode-Implementierungscode


<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
   </span><span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
python开发,自动化获取网页编码方式用到了chardet库,字符集检测,这个类在python2.7中没有,需要在官网上下载。
这里我下载好了chardet-2.3.0.tar.gz压缩包文件,只需要将压缩包文件解压后的chardet文件放到python安装包下的
python27/lib/site-packages/下,就可以了。</span>

Dann importieren Sie Chardet

und schreiben Sie eine automatische Erkennung Funktion für Erkennt URL-Verbindungen und gibt dann die Codierungsmethode der Webseiten-URL zurück.


import chardet #字符集检测 
import urllib 
 
url="http://www.jd.com" 
 
 
def automatic_detect(url): 
  content=urllib.urlopen(url).read() 
  result=chardet.detect(content) 
 
  encoding=result[&#39;encoding&#39;] 
 
  return encoding 
 
urls=[&#39;http://www.baidu.com&#39;,&#39;http://www.163.com&#39;,&#39;http://dangdang.com&#39;] 
for url in urls: 
  print url,automatic_detect(url)

Das Obige verwendet die Erkennungsmethode der Chardet-Klasse, gibt das Wörterbuch zurück und nimmt dann die Kodierungsmethodenkodierung heraus

Vielen Dank fürs Lesen, ich hoffe, es hilft. Vielen Dank an alle für die Unterstützung dieser Website!

Das obige ist der detaillierte Inhalt vonVerwenden Sie Python, um den Implementierungscode für die Webseitenkodierungsmethode abzurufen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn