머리말
국립통계국 홈페이지에는 비교적 완전한 행정구역 코드가 있는데 일부 홈페이지의 경우 이는 매우 기본적인 데이터이기 때문에 이 부분을 캡처하기 위해 Python 프로그램을 작성했습니다.
참고: 잡은 후 간단한 수동 정렬이 필요합니다
샘플 코드:
# -*- coding:utf-8 -*- ''' 获取国家统计局上的行政区划码 ''' import requests,re base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html' def get_xzqh(): html_data = requests.get(base_url).content pattern = re.compile('<p class="MsoNormal" style=".*?"><span lang="EN-US" style=".*?">(\d+)<span>.*?</span></span><span style=".*?">(.*?)</span></p>') areas = re.findall(pattern,html_data) print "code,name,level" for area in areas: print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ') if __name__=='__main__': get_xzqh()
참고:
또한 QQ 소프트웨어와 함께 제공되는 국가 및 지역 정보 테이블인 국가 및 지역 테이블에 대한 정보를 얻는 또 다른 방법이 있습니다. (파일명은 LocList.xml
), 일반 저장 위치는 C:Program FilesTencentQQI18N2052
중국어 버전을 원하시면 QQ 중국어 버전을 설치하세요. 영어 버전을 원하시면 QQ 영어 버전을 설치하세요. 국제 버전은 카탈로그 1033에 있습니다.
코드는 모두 ISO3166 표준에 따라 작성되었으며 데이터베이스로 쉽게 가져올 수 있습니다.
요약
위 내용은 Python을 사용하여 행정 구역 코드를 얻는 방법에 대한 내용입니다. Python을 배우거나 사용하는 모든 사람에게 이 기사의 내용이 도움이 되기를 바랍니다. 궁금한 점이 있으면 메시지를 남겨주세요.