Maison >développement back-end >Tutoriel Python >La technologie sous-jacente de Python révélée : comment capturer et stocker des données
Les secrets de la technologie sous-jacente de Python : comment mettre en œuvre la capture et le stockage des données nécessite des exemples de code spécifiques
Avec la popularisation d'Internet et l'accélération du processus de numérisation, les données deviennent de plus en plus importantes pour les entreprises et les particuliers. Python est devenu l'un des langages dominants dans le domaine du traitement des données en raison de ses avantages d'être facile à apprendre, puissant et flexible. Cet article présentera la technologie sous-jacente de Python et explorera en profondeur comment utiliser Python pour capturer et stocker des données via un exemple de code.
1. Capture de données
1. Utilisez le module urllib
urllib est la bibliothèque de requêtes HTTP intégrée de Python, qui fournit des fonctions HTTP de base, notamment la demande de données, l'ajout d'informations d'en-tête, la vérification du navigateur, etc. Voici l'exemple de code :
import urllib.request url = 'https://www.baidu.com/' response = urllib.request.urlopen(url) html_str = response.read().decode("utf-8") print(html_str)
2. Utilisez le module de requêtes
requests est une bibliothèque tierce et doit être installée à l'aide de pip. Par rapport à urllib, il est plus simple et plus pratique. Il peut également être utilisé pour envoyer des requêtes HTTP, ajouter des informations d'en-tête, vérifier le navigateur, etc. Voici un exemple de code :
import requests url = 'https://www.baidu.com/' response = requests.get(url) html_str = response.text print(html_str)
3. Utilisez le module Selenium
Selenium est un outil de test automatisé, mais il peut également être utilisé pour explorer les données d'une page Web. Vous devez d'abord installer Selenium et le pilote de navigateur correspondant, puis utiliser l'objet webdriver pour ouvrir la page Web à des fins d'exploitation et d'extraction de données. Voici l'exemple de code :
from selenium import webdriver url = 'https://www.baidu.com/' browser = webdriver.Firefox() browser.get(url) html_str = browser.page_source print(html_str) browser.quit()
2. Stockage des données
1. Utilisez le module csv
csv est un module intégré à Python pour exploiter des fichiers au format csv. Les fichiers CSV sont des fichiers texte brut avec des valeurs séparées par des virgules et chaque ligne représente un enregistrement de données. Voici l'exemple de code :
import csv data = [['name', 'age', 'gender'], ['Anna', '25', 'female'], ['Bob', '30', 'male'], ['Cathy', '27', 'female']] with open('data.csv', 'w') as f: writer = csv.writer(f) for row in data: writer.writerow(row)
2. Utilisez le module pandas
pandas est une bibliothèque tierce et doit être installée à l'aide de pip. Il fournit des outils de structure et d'analyse de données rapides et efficaces, qui peuvent facilement mettre en œuvre le traitement et le stockage des données. Voici l'exemple de code :
import pandas as pd data = {'name': ['Anna', 'Bob', 'Cathy'], 'age': [25, 30, 27], 'gender': ['female', 'male', 'female']} df = pd.DataFrame(data) df.to_csv('data.csv', index=False)
3. Utilisez le module sqlite3
sqlite3 est une base de données légère intégrée à Python qui peut être utilisée pour stocker et interroger des données. Voici l'exemple de code :
import sqlite3 conn = sqlite3.connect('data.db') cursor = conn.cursor() cursor.execute('''CREATE TABLE students (name text, age int, gender text)''') data = [('Anna', 25, 'female'), ('Bob', 30, 'male'), ('Cathy', 27, 'female')] cursor.executemany('INSERT INTO students VALUES (?,?,?)', data) conn.commit() conn.close()
Ce qui précède est la méthode de base et l'exemple de code permettant à Python d'implémenter la capture et le stockage de données. Il convient de noter qu'en utilisation réelle, l'anti-crawling, la gestion des exceptions, le multithreading et d'autres problèmes doivent être pris en compte afin d'obtenir un traitement de données efficace, stable et légal. Dans le même temps, vous devez respecter les lois, les réglementations et l'éthique, et ne pas utiliser la technologie des robots d'exploration pour obtenir et abuser des données d'autrui.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!