>  기사  >  백엔드 개발  >  Python을 사용하여 행정 구역 코드를 캡처하는 방법

Python을 사용하여 행정 구역 코드를 캡처하는 방법

WBOY
WBOY원래의
2016-12-05 13:27:191868검색

머리말

국립통계국 홈페이지에는 비교적 완전한 행정구역 코드가 있는데 일부 홈페이지의 경우 이는 매우 기본적인 데이터이기 때문에 이 부분을 캡처하기 위해 Python 프로그램을 작성했습니다.

참고: 잡은 후 간단한 수동 정렬이 필요합니다

샘플 코드:

# -*- coding:utf-8 -*-
'''
获取国家统计局上的行政区划码
'''
import requests,re
base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html'
 
def get_xzqh():
 html_data = requests.get(base_url).content
 pattern = re.compile('<p class="MsoNormal" style=".*&#63;"><span lang="EN-US" style=".*&#63;">(\d+)<span>.*&#63;</span></span><span style=".*&#63;">(.*&#63;)</span></p>')
 areas = re.findall(pattern,html_data)
 print "code,name,level"
 for area in areas:
  print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ')
 
if __name__=='__main__':
 get_xzqh()

참고:

또한 QQ 소프트웨어와 함께 제공되는 국가 및 지역 정보 테이블인 국가 및 지역 테이블에 대한 정보를 얻는 또 다른 방법이 있습니다. (파일명은 LocList.xml), 일반 저장 위치는 C:Program FilesTencentQQI18N2052

중국어 버전을 원하시면 QQ 중국어 버전을 설치하세요. 영어 버전을 원하시면 QQ 영어 버전을 설치하세요. 국제 버전은 카탈로그 1033에 있습니다.

코드는 모두 ISO3166 표준에 따라 작성되었으며 데이터베이스로 쉽게 가져올 수 있습니다.

요약

위 내용은 Python을 사용하여 행정 구역 코드를 얻는 방법에 대한 내용입니다. Python을 배우거나 사용하는 모든 사람에게 이 기사의 내용이 도움이 되기를 바랍니다. 궁금한 점이 있으면 메시지를 남겨주세요.

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.