通過FireDucks增壓您的數據工作流程:Python庫125倍比Pandas
快。
您是否厭倦了無休止的等待大熊貓處理大量數據集? 在快速的數據科學世界中,效率是關鍵。 隨著數據集變得更大和越來越複雜,對更快的處理工具的需求變得至關重要。 由NEC開發的革命性Python圖書館FireDucks提供了一種解決方案,其速度的速度比Pandas快125倍。 這使其成為數據科學家,分析師和開發人員的寶貴資產。> 目錄的
>燃油速度:
實現的速度比熊貓快125倍。
有關詳細的基準結果,請訪問>官方結果鏈接
import pandas as pd import fireducks.pandas as fpd import numpy as np import time
num_rows = 10_000_000 df_pandas = pd.DataFrame({ 'A': np.random.randint(1, 100, num_rows), 'B': np.random.rand(num_rows), })
這將創建一個帶有1000萬行的pandas dataframe(df_pandas
),其中包含隨機整數(列'a')和浮點數(列'b')。
df_fireducks = fpd.DataFrame(df_pandas)
PANDAS DATAFRAME將轉換為FireDucks DataFrame(df_fireducks
)。
start_time = time.time() result_pandas = df_pandas.groupby('A')['B'].sum() pandas_time = time.time() - start_time print(f"Pandas execution time: {pandas_time:.4f} seconds")這衡量了pandas dataframe上的集體操作所花費的時間。
步驟5:定時fireeducks執行
start_time = time.time() result_fireducks = df_fireducks.groupby('A')['B'].sum() fireducks_time = time.time() - start_time print(f"FireDucks execution time: {fireducks_time:.4f} seconds")這將在FireDucks DataFrame上執行相同的組件操作並測量其執行時間。
>步驟6:性能比較
speed_up = pandas_time / fireducks_time print(f"FireDucks is approximately {speed_up:.2f} times faster than pandas.")這可以計算並打印熊貓上的射擊的速度提高。
fireducks的關鍵優勢
A. FireDucks由於其懶惰的評估和自動優化而在性能和易用性方面表現出色。 >
Q4。 Fireducks是免費的嗎?付費計劃提供擴展的功能。記住將替換為實際鏈接。
>以上是再見熊貓:FireDucks提供125倍的性能的詳細內容。更多資訊請關注PHP中文網其他相關文章!