Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimanakah saya boleh mengoptimumkan permintaan HTTP dalam Python untuk pemprosesan data yang cekap?

Bagaimanakah saya boleh mengoptimumkan permintaan HTTP dalam Python untuk pemprosesan data yang cekap?

DDD
DDDasal
2024-11-24 12:22:34218semak imbas

How can I optimize HTTP requests in Python for efficient data processing?

Mengoptimumkan Permintaan HTTP dalam Python

Keperluan untuk menghantar banyak permintaan HTTP dengan pantas dalam Python sering timbul, terutamanya apabila berurusan dengan set data yang besar. Walau bagaimanapun, memilih pendekatan yang paling cekap di tengah-tengah pelbagai pilihan concurrency dan threading dalam Python boleh menjadi mencabar. Satu penyelesaian yang berdaya maju terletak pada penggunaan kaedah yang mudah tetapi berkesan.

Pelaksanaan Permintaan HTTP yang Cekap

Kod berikut menunjukkan pelaksanaan yang sangat cekap dalam Python (2.6 keserasian):

import urlparse
from threading import Thread
import httplib, sys
from Queue import Queue

concurrent = 200

def doWork():
    while True:
        url = q.get()
        status, url = getStatus(url)
        doSomethingWithResult(status, url)
        q.task_done()

def getStatus(ourl):
    try:
        url = urlparse(ourl)
        conn = httplib.HTTPConnection(url.netloc)
        conn.request("HEAD", url.path)
        res = conn.getresponse()
        return res.status, ourl
    except:
        return "error", ourl

def doSomethingWithResult(status, url):
    print status, url

q = Queue(concurrent * 2)
for i in range(concurrent):
    t = Thread(target=doWork)
    t.daemon = True
    t.start()
try:
    for url in open('urllist.txt'):
        q.put(url.strip())
    q.join()
except KeyboardInterrupt:
    sys.exit(1)

Penjelasan

  • Multithreading: Kod menggunakan multithreading untuk melaksanakan tugas secara serentak. Benang melaksanakan permintaan HTTP secara bebas, mengurangkan kependaman berbanding dengan pelaksanaan berurutan.
  • Caching: Dengan menggunakan baris gilir (q), kod mengelakkan penghuraian URL yang tidak perlu dan penubuhan sambungan untuk setiap urutan, meningkatkan lagi kecekapan.
  • Pengoptimuman Benang: Dengan menetapkan benang daemon (t.daemon = Benar), atur cara akan ditamatkan dengan anggun jika utas utama terkeluar tanpa diduga.
  • Permintaan HTTP HEAD: Kaedah "HEAD" digunakan untuk mendapatkan semula status sahaja kod tanpa memuat turun keseluruhan halaman web, meminimumkan penggunaan lebar jalur.

Penyelesaian yang dioptimumkan ini mengatasi kaedah tradisional, menggunakan pendekatan diperkemas yang mengimbangi penggunaan sumber dan kelajuan pelaksanaan tugas.

Atas ialah kandungan terperinci Bagaimanakah saya boleh mengoptimumkan permintaan HTTP dalam Python untuk pemprosesan data yang cekap?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn