Pythonデータマイニングの詳細な分析 Json構造分析-Python チュートリアル-php.cn

ホームページ

バックエンド開発

Python チュートリアル

Pythonデータマイニングの詳細な分析 Json構造分析

不言

Apr 21, 2018 pm 02:26 PM

javascriptjsonpython

この記事は、Python データマイニングと Json 構造分析の関連知識ポイントを例を通じて分析してまとめています。これに興味のある友人は参照してください。

jsonは、構成ファイル形式とも言える軽量のデータ交換形式です

この形式のファイルは、データ処理でよく遭遇するものです

pythonは、組み込みモジュールを提供しますjson は使用前にインポートするだけです

ヘルプ機能を使用して json のヘルプドキュメントを表示できます

json の一般的に使用されるメソッドには、load、loads、dump、dumps が含まれます。これらはすべて次のメソッドに属します。私はPythonの初心者なので、あまり説明しません

jsonはデータベースと組み合わせて使用でき、将来大量のデータを処理するときに非常に役立ちます

ここで、データマイニングを正式に使用して、 jsonファイルを処理します

現在、多くのWebサイトがAjaxを使用しているため、一般にXHRファイルが多いです

ここでは地図Webサイトを使用してデモンストレーションしたいと思います

ブラウザのデバッグを通じて関連するURLを取得しました

https:/ /ditu.amap.com/service/ poiInfo?id=B001B0IZY1&query_type=IDQ

以下では、requests モジュールの get メソッドを使用して、ブラウザーによって発行された http リクエストをシミュレートし、結果オブジェクトを返します

コードは次のとおりです

# coding=utf-8
__Author__ = "susmote"

import requests
url = "https://ditu.amap.com/service/poiInfo?id=B001B0IZY1&query_type=IDQ"

resp = requests.get(url)
print(resp.text[0:200])

結果をターミナルで実行すると以下のようになります

データは取得できましたが、次にこのデータを利用するためにはjsonモジュールを使ってデータを解析する必要があります

コードは次のとおりです

import requests
import json

url = "https://ditu.amap.com/service/poiInfo?id=B001B0IZY1&query_type=IDQ"

resp = requests.get(url)

json_dict = json.loads(resp.text)

print(type(json_dict))

print(json_dict.keys())

上記のコードについて簡単に説明します:

jsonモジュールをインポートし、loadsメソッドを呼び出し、返されたテキストをメソッドのパラメータとして渡します

ターミナルでの実行結果は以下の通りです

type (json_dict) はを返すので、変換結果は json 文字列に対応する辞書であることがわかります

オブジェクトは辞書であるため、ここで、keys メソッドを呼び出します

結果は、status、searcOpt、data という 3 つのキーを返します

data キーのデータを確認してみましょう

import requests
import json

url = "https://ditu.amap.com/service/poiInfo?id=B001B0IZY1&query_type=IDQ"

resp = requests.get(url)

json_dict = json.loads(resp.text)

print(json_dict[&#39;data&#39;])

このコードをターミナルで実行してください

など、必要なデータがたくさんあることがわかります。データを 1 つずつマークするのではなく、Web ページに表示されているものと比較することで、どれが役立つかを知ることができます。

これで、コードを通じて有用な情報を取得し、それを明確に出力します

# coding=utf-8
__Author__ = "susmote"

import requests
import json

url = "https://ditu.amap.com/service/poiInfo?id=B001B0IZY1&query_type=IDQ"

resp = requests.get(url)

json_dict = json.loads(resp.text)

data_dict = json_dict[&#39;data&#39;]

data_list = data_dict[&#39;poi_list&#39;]

dis_data = data_list[0]

print(&#39;城市： &#39;, dis_data[&#39;cityname&#39;])
print(&#39;名称： &#39;, dis_data[&#39;name&#39;])
print(&#39;电话： &#39;, dis_data[&#39;tel&#39;])
print(&#39;区号： &#39;, dis_data[&#39;areacode&#39;])
print(&#39;地址： &#39;, dis_data[&#39;address&#39;])
print(&#39;经度： &#39;, dis_data[&#39;longitude&#39;])
print(&#39;纬度： &#39;, dis_data[&#39;latitude&#39;])

ファイル構造の研究を通じて、辞書はリストでネストされているため、リストは辞書でネストされています。レイヤーごとのブロック解除を通じて、データは正常に取得されます

ここで手順を個別にリストしたので、より明確に確認できます

次に、ターミナルを通じてプログラムを実行して情報を取得します。とても簡単ですね

このプログラムは、他の場所から情報を取得するときに、URLを変更するだけで済みます

たとえば、次の例は北京大学です。

または Tencent Tower

データマイニングに終わりはありません。皆さんがもっとデータを分析して、必要なデータを見つけられることを願っています

関連する推奨事項 :

numpy の処理方法。 Python データの中央値

以上がPythonデータマイニングの詳細な分析 Json構造分析の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

es6数组怎么去掉重复并且重新排序May 05, 2022 pm 07:08 PM

去掉重复并排序的方法：1、使用“Array.from(new Set(arr))”或者“[…new Set(arr)]”语句，去掉数组中的重复元素，返回去重后的新数组；2、利用sort()对去重数组进行排序，语法“去重数组.sort()”。

JavaScript的Symbol类型、隐藏属性及全局注册表详解Jun 02, 2022 am 11:50 AM

本篇文章给大家带来了关于JavaScript的相关知识，其中主要介绍了关于Symbol类型、隐藏属性及全局注册表的相关问题，包括了Symbol类型的描述、Symbol不会隐式转字符串等问题，下面一起来看一下，希望对大家有帮助。

原来利用纯CSS也能实现文字轮播与图片轮播！Jun 10, 2022 pm 01:00 PM

怎么制作文字轮播与图片轮播？大家第一想到的是不是利用js，其实利用纯CSS也能实现文字轮播与图片轮播，下面来看看实现方法，希望对大家有所帮助！

JavaScript对象的构造函数和new操作符（实例详解）May 10, 2022 pm 06:16 PM

本篇文章给大家带来了关于JavaScript的相关知识，其中主要介绍了关于对象的构造函数和new操作符，构造函数是所有对象的成员方法中，最早被调用的那个，下面一起来看一下吧，希望对大家有帮助。

JavaScript面向对象详细解析之属性描述符May 27, 2022 pm 05:29 PM

本篇文章给大家带来了关于JavaScript的相关知识，其中主要介绍了关于面向对象的相关问题，包括了属性描述符、数据描述符、存取描述符等等内容，下面一起来看一下，希望对大家有帮助。

javascript怎么移除元素点击事件Apr 11, 2022 pm 04:51 PM

方法：1、利用“点击元素对象.unbind("click");”方法，该方法可以移除被选元素的事件处理程序；2、利用“点击元素对象.off("click");”方法，该方法可以移除通过on()方法添加的事件处理程序。

foreach是es6里的吗May 05, 2022 pm 05:59 PM

foreach不是es6的方法。foreach是es3中一个遍历数组的方法，可以调用数组的每个元素，并将元素传给回调函数进行处理，语法“array.forEach(function(当前元素,索引,数组){...})”；该方法不处理空数组。

整理总结JavaScript常见的BOM操作Jun 01, 2022 am 11:43 AM

本篇文章给大家带来了关于JavaScript的相关知识，其中主要介绍了关于BOM操作的相关问题，包括了window对象的常见事件、JavaScript执行机制等等相关内容，下面一起来看一下，希望对大家有帮助。

See all articles

ホットAIツール

ホットツール

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティングサービスをチェックしてください。

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、