Rumah >Peranti teknologi >AI >Selamat tinggal Pandas: Fireducks menawarkan prestasi lebih pantas 125x

Selamat tinggal Pandas: Fireducks menawarkan prestasi lebih pantas 125x

Joseph Gordon-Levitt
Joseph Gordon-Levittasal
2025-03-09 10:54:14778semak imbas

Meningkatkan aliran kerja data anda dengan Fireducks: Perpustakaan Python 125x lebih cepat daripada Pandas

Adakah anda bosan dengan menunggu panda untuk memproses dataset besar? Dalam dunia sains data yang pantas, kecekapan adalah kunci. Apabila dataset tumbuh lebih besar dan lebih kompleks, keperluan untuk alat pemprosesan yang lebih cepat menjadi kritikal. Fireducks, sebuah perpustakaan python revolusioner yang dibangunkan oleh NEC, menawarkan kelajuan penyelesaian penyelesaian sehingga 125 kali lebih cepat daripada panda. Ini menjadikannya aset yang tidak ternilai untuk saintis data, penganalisis, dan pemaju.

Jadual Kandungan

  • Apa itu Fireducks?
  • Penanda aras prestasi
  • Fireducks vs Pandas: Perbandingan Praktikal
    • Langkah 1: Mengimport Perpustakaan
    • Langkah 2: Menjana data sampel
    • Langkah 3: Membuat DataFrame Fireducks
    • Langkah 4: Pelaksanaan Pandas Masa
    • Langkah 5: Pelaksanaan Fireducks Masa
    • Langkah 6: Perbandingan Prestasi
  • Kelebihan Utama Fireducks
  • Sumber Berguna
  • Soalan Lazim

Apa itu Fireducks?

Fireducks adalah perpustakaan python berprestasi tinggi yang direka untuk menyelaraskan analisis data. Memanfaatkan kepakaran NEC yang luas dalam pengkomputeran berprestasi tinggi, fireducks memberikan kelajuan dan kecekapan yang luar biasa.

  • kelajuan blazing: mencapai sehingga 125 kali pemprosesan lebih cepat daripada panda.
  • keserasian lancar: menggunakan API Pandas yang biasa, meminimumkan perubahan kod.
  • Pengoptimuman pintar: menggunakan penilaian malas untuk mengoptimumkan operasi dan memulihara sumber.

Penanda aras prestasi

Prestasi Fireducks diuji dengan ketat menggunakan DB-Benchmark, satu penanda aras yang menilai operasi sains data teras (seperti Joins dan GroupBys) pada dataset yang berbeza-beza saiz. Sehingga 10 September 2024, Fireducks menunjukkan prestasi unggul, mengukuhkan kedudukannya sebagai pelaku utama untuk Groupby dan menyertai operasi pada dataset besar.

Goodbye Pandas: FireDucks Offers 125x Faster Performance

    Untuk hasil penanda aras terperinci, lawati
  • Pautan Hasil Rasmi .
  • butiran penanda aras yang komprehensif boleh didapati di
  • Butiran Butiran Bencana .
Fireducks vs Pandas: Perbandingan Praktikal

mari kita bandingkan fireducks dan panda menggunakan senario dunia sebenar. Kami akan memuatkan data, menapis, melakukan operasi kumpulan, dan agregat, menonjolkan kelebihan kelajuan fireducks.

Langkah 1: Mengimport Perpustakaan

import pandas as pd
import fireducks.pandas as fpd
import numpy as np
import time

Langkah 2: Menjana data sampel

num_rows = 10_000_000
df_pandas = pd.DataFrame({
    'A': np.random.randint(1, 100, num_rows),
    'B': np.random.rand(num_rows),
})

Ini mewujudkan data Pandas DataFrame (df_pandas) dengan 10 juta baris, yang mengandungi bilangan bulat rawak (lajur 'A') dan nombor terapung (lajur 'B').

Langkah 3: Membuat DataFrame Fireducks

df_fireducks = fpd.DataFrame(df_pandas)

DataFrame Pandas diubah menjadi data dataframe fireducks (). df_fireducks

Langkah 4: Pelaksanaan Pandas Masa

start_time = time.time()
result_pandas = df_pandas.groupby('A')['B'].sum()
pandas_time = time.time() - start_time
print(f"Pandas execution time: {pandas_time:.4f} seconds")
ini mengukur masa yang diambil untuk operasi kumpulan pada data Pandas.

Langkah 5: Pelaksanaan Fireducks Masa

start_time = time.time()
result_fireducks = df_fireducks.groupby('A')['B'].sum()
fireducks_time = time.time() - start_time
print(f"FireDucks execution time: {fireducks_time:.4f} seconds")
Ini melakukan operasi kumpulan yang sama pada data Fireducks dan mengukur masa pelaksanaannya.

Langkah 6: Perbandingan Prestasi

speed_up = pandas_time / fireducks_time
print(f"FireDucks is approximately {speed_up:.2f} times faster than pandas.")
ini mengira dan mencetak peningkatan kelajuan fireducks ke atas panda.

Kelebihan Utama Fireducks

  • Sokongan platform yang luas: berfungsi dengan lancar pada Linux, Windows (melalui WSL), dan MacOS.
  • Peralihan mudah: API Pandas yang biasa memastikan keluk pembelajaran yang lancar.
  • Kecekapan automatik: Penilaian malas dan mengoptimumkan prestasi mengoptimumkan prestasi di belakang tabir.
Sumber Berguna

Dokumentasi Rasmi
  • : repositori GitHub:
  • Fireducks GitHub
  • NYC Demo Notebook:
  • NYC Demo Notebook Link
  • twitter/x:
  • @fireducksdev
  • Kesimpulan
  • Fireducks menawarkan peningkatan dramatik dalam kecekapan analisis data, mencapai kelajuan sehingga 125 kali lebih cepat daripada panda. Keserasiannya dengan API PANDAS, penilaian malas, dan pengoptimuman automatik menjadikannya alat yang berkuasa untuk profesional data yang bekerja dengan dataset yang besar.

Soalan Lazim

Q1. Adakah fireducks serasi dengan panda?

A. Ya, ia menggunakan API yang sama.

Q2. Bolehkah Fireducks digunakan pada Windows? A. Ya, melalui WSL.

Q3. Bagaimanakah Fireducks dibandingkan dengan polar atau dask? A. Fireducks cemerlang dalam prestasi dan kemudahan penggunaan kerana penilaian malas dan pengoptimuman automatik.

Q4. Adakah fireducks percuma? A. Ya, pelan percuma boleh didapati dengan ciri -ciri terhad; Pelan berbayar menawarkan fungsi yang diperluaskan.

ingat untuk menggantikan

dengan pautan sebenar.

Atas ialah kandungan terperinci Selamat tinggal Pandas: Fireducks menawarkan prestasi lebih pantas 125x. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn