Heim > Artikel > Backend-Entwicklung > So verwenden Sie Python zum Erfassen von Verwaltungsabteilungscodes
Vorwort
Die Website des National Bureau of Statistics verfügt über relativ vollständige Verwaltungsabteilungscodes. Bei einigen Websites handelt es sich um sehr grundlegende Daten. Daher habe ich ein Python-Programm geschrieben, um diesen Teil der Daten zu erfassen.
Hinweis: Nach dem Greifen ist eine einfache manuelle Nachbearbeitung erforderlich
Beispielcode:
# -*- coding:utf-8 -*- ''' 获取国家统计局上的行政区划码 ''' import requests,re base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html' def get_xzqh(): html_data = requests.get(base_url).content pattern = re.compile('<p class="MsoNormal" style=".*?"><span lang="EN-US" style=".*?">(\d+)<span>.*?</span></span><span style=".*?">(.*?)</span></p>') areas = re.findall(pattern,html_data) print "code,name,level" for area in areas: print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ') if __name__=='__main__': get_xzqh()
Hinweis:
Darüber hinaus gibt es eine weitere Möglichkeit, Informationen über die Länder- und Regionstabelle zu erhalten, nämlich die Länder- und Regionsinformationstabelle, die mit der QQ-Software geliefert wird. (Der Dateiname ist LocList.xml
), der allgemeine Speicherort ist: C:Program FilesTencentQQI18N2052
Wenn Sie die chinesische Version möchten, installieren Sie die chinesische Version von QQ, um sie zu erhalten. Wenn Sie die englische Version möchten, installieren Sie die englische Version von QQ. Die internationale Version finden Sie im Katalog 1033.
Die Codes sind alle gemäß ISO3166-Standards geschrieben und lassen sich einfach in die Datenbank importieren.
Zusammenfassung
Oben dreht sich alles um die Verwendung von Python zum Erhalten von Verwaltungsabteilungscodes. Ich hoffe, dass der Inhalt dieses Artikels für alle beim Erlernen oder Verwenden von Python hilfreich sein kann. Wenn Sie Fragen haben, können Sie eine Nachricht hinterlassen.