Rumah >Peranti teknologi >AI >Selamat tinggal Pandas: Fireducks menawarkan prestasi lebih pantas 125x
Meningkatkan aliran kerja data anda dengan Fireducks: Perpustakaan Python 125x lebih cepat daripada Pandas
Adakah anda bosan dengan menunggu panda untuk memproses dataset besar? Dalam dunia sains data yang pantas, kecekapan adalah kunci. Apabila dataset tumbuh lebih besar dan lebih kompleks, keperluan untuk alat pemprosesan yang lebih cepat menjadi kritikal. Fireducks, sebuah perpustakaan python revolusioner yang dibangunkan oleh NEC, menawarkan kelajuan penyelesaian penyelesaian sehingga 125 kali lebih cepat daripada panda. Ini menjadikannya aset yang tidak ternilai untuk saintis data, penganalisis, dan pemaju.
Fireducks adalah perpustakaan python berprestasi tinggi yang direka untuk menyelaraskan analisis data. Memanfaatkan kepakaran NEC yang luas dalam pengkomputeran berprestasi tinggi, fireducks memberikan kelajuan dan kecekapan yang luar biasa.
Prestasi Fireducks diuji dengan ketat menggunakan DB-Benchmark, satu penanda aras yang menilai operasi sains data teras (seperti Joins dan GroupBys) pada dataset yang berbeza-beza saiz. Sehingga 10 September 2024, Fireducks menunjukkan prestasi unggul, mengukuhkan kedudukannya sebagai pelaku utama untuk Groupby dan menyertai operasi pada dataset besar.
import pandas as pd import fireducks.pandas as fpd import numpy as np import time
num_rows = 10_000_000 df_pandas = pd.DataFrame({ 'A': np.random.randint(1, 100, num_rows), 'B': np.random.rand(num_rows), })
Ini mewujudkan data Pandas DataFrame (df_pandas
) dengan 10 juta baris, yang mengandungi bilangan bulat rawak (lajur 'A') dan nombor terapung (lajur 'B').
df_fireducks = fpd.DataFrame(df_pandas)
DataFrame Pandas diubah menjadi data dataframe fireducks (df_fireducks
start_time = time.time() result_pandas = df_pandas.groupby('A')['B'].sum() pandas_time = time.time() - start_time print(f"Pandas execution time: {pandas_time:.4f} seconds")ini mengukur masa yang diambil untuk operasi kumpulan pada data Pandas.
Langkah 5: Pelaksanaan Fireducks Masa
start_time = time.time() result_fireducks = df_fireducks.groupby('A')['B'].sum() fireducks_time = time.time() - start_time print(f"FireDucks execution time: {fireducks_time:.4f} seconds")Ini melakukan operasi kumpulan yang sama pada data Fireducks dan mengukur masa pelaksanaannya.
Langkah 6: Perbandingan Prestasi
speed_up = pandas_time / fireducks_time print(f"FireDucks is approximately {speed_up:.2f} times faster than pandas.")ini mengira dan mencetak peningkatan kelajuan fireducks ke atas panda.
Kelebihan Utama Fireducks
Q1. Adakah fireducks serasi dengan panda?
Q2. Bolehkah Fireducks digunakan pada Windows? A. Ya, melalui WSL.
Q3. Bagaimanakah Fireducks dibandingkan dengan polar atau dask? A. Fireducks cemerlang dalam prestasi dan kemudahan penggunaan kerana penilaian malas dan pengoptimuman automatik.
Q4. Adakah fireducks percuma? A. Ya, pelan percuma boleh didapati dengan ciri -ciri terhad; Pelan berbayar menawarkan fungsi yang diperluaskan.
ingat untuk menggantikandengan pautan sebenar.
Atas ialah kandungan terperinci Selamat tinggal Pandas: Fireducks menawarkan prestasi lebih pantas 125x. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!