Rumah >pembangunan bahagian belakang >tutorial php >Cara untuk mengekstrak data daripada fail XML dan JSON di web

Cara untuk mengekstrak data daripada fail XML dan JSON di web

WBOY
WBOYasal
2023-06-13 09:05:172128semak imbas

Artikel ini akan memperkenalkan cara mengekstrak data daripada fail XML dan JSON di Internet. XML dan JSON adalah format data yang biasa digunakan pada masa ini, jadi sangat perlu untuk menguasai kaedah untuk mengekstrak maklumat berguna daripadanya.

1. Kaedah pengekstrakan data XML

XML (Extensible Markup Language) ialah bahasa penanda yang digunakan untuk menyimpan dan menghantar data. Data XML terdiri daripada tag, atribut, teks dan ulasan. Berikut ialah cara untuk mengekstrak data daripada fail XML melalui Python.

  1. Menggunakan modul ElementTree

Modul ElementTree dalam Python ialah cara untuk memproses data XML. Ia boleh menghuraikan fail XML ke dalam objek Element Tree dan menyediakan satu siri kaedah untuk mengendalikan objek. Berikut ialah contoh mudah:

import xml.etree.ElementTree as ET

tree = ET.parse('data.xml')
root = tree.getroot()

for child in root:
    print(child.tag, child.attrib)

Kod ini akan mencetak teg dan atribut setiap elemen dalam fail XML.

  1. Menggunakan XPath

XPath ialah bahasa untuk memilih nod XML. Ia menyediakan cara yang mudah untuk mencari dan mengekstrak data XML. Untuk menggunakan XPath, anda boleh menggunakan kaedah Element.findall() dan Element.find() dalam modul ElementTree. Berikut ialah contoh:

import xml.etree.ElementTree as ET

tree = ET.parse('data.xml')
root = tree.getroot()

# 获取所有book元素
books= root.findall('.//book')

# 获取第一个book元素的author子元素的值
author = root.find(".//book[1]/author").text

Kod ini akan mendapat nilai semua elemen buku dalam fail XML dan sub-elemen pengarang bagi elemen buku pertama.

2. Kaedah pengekstrakan data JSON

JSON (JavaScript Object Notation) ialah format pertukaran data ringan yang strukturnya serupa dengan kamus dalam Python. Berikut ialah cara menggunakan Python untuk mengekstrak data daripada fail JSON.

  1. Menggunakan modul json

Modul json dalam Python boleh menukar rentetan JSON kepada kamus atau senarai Python. Rentetan JSON boleh ditukar menjadi objek Python menggunakan kaedah json.loads(), seperti yang ditunjukkan di bawah:

import json

json_str = '{"name": "Alice", "age": 25, "city": "New York"}'
data = json.loads(json_str)

print(data["name"])

Kod ini akan mengeluarkan "Alice".

  1. Gunakan pengindeksan

Selepas menukar rentetan JSON kepada objek Python, ia boleh dimanipulasi sama seperti kamus dan senarai. Sebagai contoh, anda boleh menggunakan indeks untuk mendapatkan nilai untuk kunci. Berikut ialah contoh:

import json

json_str = '{"name": "Alice", "age": 25, "city": "New York"}'
data = json.loads(json_str)

print(data["name"])

Kod ini akan mengeluarkan "Alice".

Ringkasan

Artikel ini memperkenalkan kaedah untuk mengekstrak data daripada fail XML dan JSON di web. Menggunakan modul ElementTree dan XPath dalam Python memudahkan untuk mengekstrak data daripada fail XML, sambil menggunakan modul json anda boleh menukar rentetan JSON ke objek Python dan kemudian memanipulasinya seperti kamus dan senarai. Menguasai kemahiran ini boleh membantu kami memproses data dengan lebih cekap.

Atas ialah kandungan terperinci Cara untuk mengekstrak data daripada fail XML dan JSON di web. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn