이 글은 Python 데이터 마이닝과 Json 구조 분석에 관련된 지식 포인트를 예제를 통해 분석하고 요약한 것입니다. 이에 관심이 있는 친구들은 참고할 수 있습니다.
json은 구성 파일 형식이라고도 할 수 있는 경량 데이터 교환 형식입니다.
이 형식의 파일은 데이터 처리에서 자주 접하는 파일입니다.
python 내장 모듈 json 제공 , 사용하기 전에 가져오기만 하면 됩니다
도움말 기능을 통해 json 도움말 문서를 볼 수 있습니다
json에서 일반적으로 사용되는 방법에는 로드, 로드, 덤프 및 덤프가 포함되며 모두 I'에 속합니다. 파이썬 초보자라 길게 설명하지 않겠습니다
json은 데이터베이스와 연동해서 사용할 수 있어서 앞으로 대용량 데이터를 처리할 때 매우 유용합니다
이제 정식으로 데이터 마이닝을 사용해 json을 처리하겠습니다. files
이제 많은 웹사이트에서 Ajax를 사용하기 때문에 일반적으로 XHR 파일이 많습니다
이를 통해 지도 웹사이트를 사용하여 시연하려고 합니다
브라우저 디버깅을 통해 관련 URL을 얻었습니다
https:/ /ditu.amap.com/service/ poiInfo?id=B001B0IZY1&query_type=IDQ
이제 요청 모듈의 get 메소드를 사용하여 브라우저에서 발행한 http 요청을 시뮬레이션하고 결과 객체를 반환합니다
코드는 다음과 같습니다.
# coding=utf-8 __Author__ = "susmote" import requests url = "https://ditu.amap.com/service/poiInfo?id=B001B0IZY1&query_type=IDQ" resp = requests.get(url) print(resp.text[0:200])
결과를 터미널에서 실행해 보세요
데이터를 얻었으나 다음에 이 데이터를 사용하기 위해서는 json 모듈을 이용해 데이터를 분석해야 합니다
코드 는 다음과 같습니다
import requests import json url = "https://ditu.amap.com/service/poiInfo?id=B001B0IZY1&query_type=IDQ" resp = requests.get(url) json_dict = json.loads(resp.text) print(type(json_dict)) print(json_dict.keys())
위 코드에 대해 간략하게 설명하자면:
json 모듈을 가져온 후 로드 메소드를 호출하고 반환된 텍스트를 메소드의 매개변수로 전달합니다.
터미널에서 실행한 결과
type(json_dict)이 7f7a529d7c829355be039cf711e6e765
객체가 Dictionary이므로 변환 결과가 json 문자열에 해당하는 Dictionary임을 알 수 있으며, 여기서는 키 메서드를 호출합니다.
결과는 세 개의 키, 즉 status, searcOpt, data를 반환합니다.
데이터 키의 데이터를 확인해 보겠습니다
import requests import json url = "https://ditu.amap.com/service/poiInfo?id=B001B0IZY1&query_type=IDQ" resp = requests.get(url) json_dict = json.loads(resp.text) print(json_dict['data'])
이 코드를 터미널에서 실행해 보세요.
하나하나 표시하는 것이 아니라 웹 페이지에 표시되는 내용과 비교해 보면 어떤 것이 유용한지 알 수 있습니다.
이제 코드를 통해 유용한 정보를 얻고 명확하게 출력합니다
# coding=utf-8 __Author__ = "susmote" import requests import json url = "https://ditu.amap.com/service/poiInfo?id=B001B0IZY1&query_type=IDQ" resp = requests.get(url) json_dict = json.loads(resp.text) data_dict = json_dict['data'] data_list = data_dict['poi_list'] dis_data = data_list[0] print('城市: ', dis_data['cityname']) print('名称: ', dis_data['name']) print('电话: ', dis_data['tel']) print('区号: ', dis_data['areacode']) print('地址: ', dis_data['address']) print('经度: ', dis_data['longitude']) print('纬度: ', dis_data['latitude'])
파일 구조 연구를 통해 사전이 목록으로 중첩되어 있기 때문입니다. 목록은 사전과 중첩되어 있습니다. 레이어별 차단 해제를 통해 데이터를 성공적으로 얻었습니다
여기에 단계를 별도로 나열했기 때문에 더 명확하게 볼 수 있습니다
이제 터미널을 통해 프로그램을 실행하여 정보를 얻습니다. we want
아주 간단하지 않나요? 이 프로그램은 다른 곳에서 정보를 얻을 때 URL만 변경하면 됩니다.
예를 들어 다음 예는
Peking University입니다.
또는 Tencent Building
데이터 마이닝에는 끝이 없습니다. 모두가 데이터를 더 많이 분석하고 원하는 데이터를 찾을 수 있기를 바랍니다.
관련 권장 사항 :
위 내용은 Python 데이터 마이닝 심층 분석 Json 구조 분석의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!