ホームページ >テクノロジー周辺機器 >AI >さようならパンダ:Fireducksは、125倍のより速いパフォーマンスを提供します
ファイアードゥックでデータワークフローをスーパーチャージする:パンダよりも速いPythonライブラリ125x パンダが大規模なデータセットを処理するのを無限に待つことにうんざりしていませんか? データサイエンスのペースの速い世界では、効率が重要です。 データセットが大きくなり、より複雑になるにつれて、処理ツールをより高速化する必要性が重要になります。 NECが開発した革新的なPythonライブラリであるFireducksは、パンダよりも最大125倍速い速度を導入するソリューションを提供します。 これにより、データサイエンティスト、アナリスト、開発者にとっても非常に貴重な資産になります。
目次
公式結果リンク
。にアクセスしてください
包括的なベンチマークの詳細は、
import pandas as pd import fireducks.pandas as fpd import numpy as np import time
num_rows = 10_000_000 df_pandas = pd.DataFrame({ 'A': np.random.randint(1, 100, num_rows), 'B': np.random.rand(num_rows), })これにより、ランダムな整数(列 'a')と浮動小数点数(列 'b')を含む1,000万列のパンダデータフレーム(
)が作成されます。
df_pandas
ステップ3:Fireducks DataFrameの作成
df_fireducks = fpd.DataFrame(df_pandas)ステップ4:タイミングパンダの実行
df_fireducks
start_time = time.time() result_pandas = df_pandas.groupby('A')['B'].sum() pandas_time = time.time() - start_time print(f"Pandas execution time: {pandas_time:.4f} seconds")
これは、Fireducksのデータフレームで同じグループ操作を実行し、実行時間を測定します。
ステップ6:パフォーマンスの比較start_time = time.time() result_fireducks = df_fireducks.groupby('A')['B'].sum() fireducks_time = time.time() - start_time print(f"FireDucks execution time: {fireducks_time:.4f} seconds")これにより、パンダに対するファイヤードゥックの速度改善を計算して印刷します。
fireducksの重要な利点
speed_up = pandas_time / fireducks_time print(f"FireDucks is approximately {speed_up:.2f} times faster than pandas.")
幅広いプラットフォームサポート:
Linux、Windows(WSL経由)、およびMacOSでシームレスに動作します。 楽な移行: q3。 FireducksはPolarsまたはDaskと比較してどうですか?
を実際のリンクに置き換えることを忘れないでくださいQ4。 Fireducksは無料ですか?
A.はい、限られた機能を備えた無料プランが利用可能です。有料プランは機能の拡大を提供します。
以上がさようならパンダ:Fireducksは、125倍のより速いパフォーマンスを提供しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。