Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimanakah saya Boleh Mengoptimumkan Lelaran DataFrame dalam Panda?

Bagaimanakah saya Boleh Mengoptimumkan Lelaran DataFrame dalam Panda?

Barbara Streisand
Barbara Streisandasal
2024-11-13 08:44:02289semak imbas

How Can I Optimize DataFrame Iteration in Pandas?

Mengoptimumkan Lelaran Bingkai Data dalam Panda

Melelaran melalui bingkai data secara berurutan untuk melaksanakan analisis yang kompleks ialah tugas biasa dalam pemprosesan data kewangan. Walaupun kod yang disediakan menggunakan enumerate() dengan df.values ​​menyediakan pendekatan yang mudah, ia menimbulkan persoalan tentang kecekapannya.

Untuk menangani perkara ini, panda menawarkan penyelesaian khusus. Fungsi iterrows() membenarkan lelaran terus ke atas baris bingkai data, mengembalikan satu tuple indeks dan nilai baris yang sepadan. Kaedah ini:

for index, row in df.iterrows():
    # perform analysis based on index and row values

Untuk prestasi yang dipertingkatkan, fungsi itertuples() menawarkan alternatif yang cekap ingatan kepada iterrows().

Sebagai alternatif, pendekatan yang sangat berkesan ialah memanfaatkan fungsi numpy secara langsung pada lajur bingkai data, mengelakkan lelaran baris sama sekali. operasi numpy bertindak pada keseluruhan lajur, membolehkan pengiraan vektor yang lebih pantas. Contohnya, untuk mengira min harga terbuka:

import numpy as np
mean_open = np.mean(df['Open'])

Atas ialah kandungan terperinci Bagaimanakah saya Boleh Mengoptimumkan Lelaran DataFrame dalam Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn