首頁 >科技週邊 >人工智慧 >再見熊貓:FireDucks提供125倍的性能

再見熊貓:FireDucks提供125倍的性能

Joseph Gordon-Levitt
Joseph Gordon-Levitt原創
2025-03-09 10:54:14775瀏覽

通過FireDucks增壓您的數據工作流程:Python庫125倍比Pandas

快。

您是否厭倦了無休止的等待大熊貓處理大量數據集? 在快速的數據科學世界中,效率是關鍵。 隨著數據集變得更大和越來越複雜,對更快的處理工具的需求變得至關重要。 由NEC開發的革命性Python圖書館FireDucks提供了一種解決方案,其速度的速度比Pandas快125倍。 這使其成為數據科學家,分析師和開發人員的寶貴資產。

> 目錄的

>

什麼是fireducks?
  • >性能基準
  • > figeducks vs. pandas:一種實用的比較
  • >步驟1:導入庫
    • >步驟2:生成樣本數據
    • 步驟3:創建FireDucks DataFrame
    • 步驟4:計時熊貓執行
    • 步驟5:定時fireeducks執行
    • >步驟6:性能比較
    fireducks的關鍵優勢
  • >有用的資源
  • 常見問題
  • 什麼是fireducks?
FireDucks是一個高性能的Python庫,旨在簡化數據分析。 利用NEC在高性能計算方面的廣泛專業知識,Fireducks提供了出色的速度和效率。

燃油速度:

實現的速度比熊貓快125倍。
  • >無縫兼容性:使用熟悉的pandas api,最小化代碼更改。
  • 智能優化:採用懶惰評估來優化操作並節省資源。
  • >性能基準 使用DB基準測試了
  • > FireDucks的性能,DB基準是一種基準套件,評估了不同尺寸的數據集中的核心數據科學操作(如加入和GroupBys)。 截至2024年9月10日,FireDucks表現出卓越的性能,鞏固了其作為Groupby的最佳表現的地位,並在大型數據集上加入運營。

有關詳細的基準結果,請訪問Goodbye Pandas: FireDucks Offers 125x Faster Performance>官方結果鏈接

  • 綜合基準詳細信息可在>基準測試詳細信息鏈接
  • > figeducks vs. pandas:一種實用的比較 >讓我們使用現實世界的場景比較Fireducks和Pandas。我們將加載數據,過濾,執行集團操作和匯總,突出顯示Fireducks的速度優勢。
  • >步驟1:導入庫

import pandas as pd
import fireducks.pandas as fpd
import numpy as np
import time

>步驟2:生成樣本數據

num_rows = 10_000_000
df_pandas = pd.DataFrame({
    'A': np.random.randint(1, 100, num_rows),
    'B': np.random.rand(num_rows),
})

這將創建一個帶有1000萬行的pandas dataframe(df_pandas),其中包含隨機整數(列'a')和浮點數(列'b')。

>

步驟3:創建FireDucks DataFrame

df_fireducks = fpd.DataFrame(df_pandas)

PANDAS DATAFRAME將轉換為FireDucks DataFrame(df_fireducks)。

步驟4:計時熊貓執行

start_time = time.time()
result_pandas = df_pandas.groupby('A')['B'].sum()
pandas_time = time.time() - start_time
print(f"Pandas execution time: {pandas_time:.4f} seconds")
這衡量了pandas dataframe上的集體操作所花費的時間。

步驟5:定時fireeducks執行

start_time = time.time()
result_fireducks = df_fireducks.groupby('A')['B'].sum()
fireducks_time = time.time() - start_time
print(f"FireDucks execution time: {fireducks_time:.4f} seconds")
這將在FireDucks DataFrame上執行相同的組件操作並測量其執行時間。

>步驟6:性能比較

speed_up = pandas_time / fireducks_time
print(f"FireDucks is approximately {speed_up:.2f} times faster than pandas.")
這可以計算並打印熊貓上的射擊的速度提高。 >

fireducks的關鍵優勢

  • 廣泛的平台支持:在Linux,Windows(通過WSL)和MacOS。
  • 輕鬆的過渡:
  • 熟悉的pandas api確保了平穩的學習曲線。
  • >自動化效率:
  • 懶惰評估和自動優化手柄幕後的性能。
  • >有用的資源

Q1。 Fireducks與Pandas兼容嗎?

Q2。可以在Windows上使用FireDucks嗎?

Q3。 FireDucks與Polars或Dask相比如何?

A. FireDucks由於其懶惰的評估和自動優化而在性能和易用性方面表現出色。 >

Q4。 Fireducks是免費的嗎?付費計劃提供擴展的功能。

記住將替換為實際鏈接。

>

以上是再見熊貓:FireDucks提供125倍的性能的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn