>기술 주변기기 >일체 포함 >Goodbye Pandas : Fireducks는 125 배 빠른 성능을 제공합니다

Goodbye Pandas : Fireducks는 125 배 빠른 성능을 제공합니다

Joseph Gordon-Levitt
Joseph Gordon-Levitt원래의
2025-03-09 10:54:14778검색
Fireducks로 데이터 워크 플로우를 과급합니다 : Pandas보다 125 배 더 빠른 Python 라이브러리 팬더가 대규모 데이터 세트를 처리 할 때까지 끝없는 기다림에 지쳤습니까? 빠르게 진행되는 데이터 과학 세계에서 효율성이 핵심입니다. 데이터 세트가 점점 더 복잡해지면서 더 빠른 처리 도구의 필요성이 중요 해집니다. NEC가 개발 한 혁신적인 파이썬 라이브러리 인 Fireducks는 솔루션을 제공합니다. 이는 팬더보다 최대 125 배 빠른 속도를 제공합니다. 이로 인해 데이터 과학자, 분석가 및 개발자 모두에게 귀중한 자산이됩니다. 목차

fireducks는 무엇입니까? 성능 벤치 마크 Fireducks vs. Pandas : 실용적인 비교

1 단계 : 라이브러리 가져 오기 2 단계 : 샘플 데이터 생성 3 단계 : Fireducks Dataframe 생성 4 단계 : 타이밍 팬더 실행 5 단계 : 타이밍 Fireducks 실행 6 단계 : 성능 비교
  • Fireducks의 주요 장점
  • 유용한 자원 자주 묻는 질문
  • fireducks는 무엇입니까? Fireducks는 데이터 분석을 간소화하도록 설계된 고성능 파이썬 라이브러리입니다. Fireducks는 고성능 컴퓨팅에 대한 NEC의 광범위한 전문 지식을 활용하여 탁월한 속도와 효율성을 제공합니다.
    • 타오르는 속도 :
    • 팬더보다 최대 125 배 더 빠른 처리를 달성하십시오. 원활한 호환성 :
    • 친숙한 Pandas API를 사용하여 코드 변경을 최소화합니다. 지능형 최적화 :
    • 는 게으른 평가를 사용하여 운영을 최적화하고 자원을 보존합니다.
    • 성능 벤치 마크 FireDucks의 성능은 다양한 크기의 데이터 세트에서 핵심 데이터 과학 운영 (조인 및 그룹 비)를 평가하는 벤치 마크 제품군 인 DB-Benchmark를 사용하여 엄격하게 테스트되었습니다. 2024 년 9 월 10 일 현재, Fireducks는 탁월한 성능을 보여 주었으며, Groupby의 최고 성능을 강화하고 대형 데이터 세트에서 작업에 참여했습니다.
    • .
    • 자세한 벤치 마크 결과를 보려면 공식 결과 링크
    • 포괄적 인 벤치마킹 세부 정보는
    • 벤치마킹 세부 사항 링크 에서 확인할 수 있습니다
  • Fireducks vs. Pandas : 실용적인 비교
실제 시나리오를 사용하여 Fireducks와 Pandas를 비교해 봅시다. 우리는 데이터, 필터, Groupby 작업 및 집계를로드하여 Fireducks의 속도 장점을 강조합니다.1 단계 : 라이브러리 가져 오기

2 단계 : 샘플 데이터 생성

이것은 임의의 정수 (열 'A')와 플로팅 포인트 숫자 (열 'B')를 포함하는 1 천만 행으로 Pandas Dataframe ()을 만듭니다. 3 단계 : Fireducks Dataframe 생성 import pandas as pd import fireducks.pandas as fpd import numpy as np import time

Pandas Dataframe은 FireDucks Dataframe ()로 변환됩니다. 4 단계 : 타이밍 팬더 실행

num_rows = 10_000_000
df_pandas = pd.DataFrame({
    'A': np.random.randint(1, 100, num_rows),
    'B': np.random.rand(num_rows),
})
이것은 Pandas Dataframe에서 Groupby 작업에 걸리는 시간을 측정합니다. 5 단계 : 타이밍 Fireducks 실행

이것은 Fireducks Dataframe에서 동일한 Groupby 작업을 수행하고 실행 시간을 측정합니다. 6 단계 : 성능 비교 df_pandas 이것은 팬더를 통한 Fireducks의 속도 개선을 계산하고 인쇄합니다. Fireducks의 주요 장점

광범위한 플랫폼 지원 :

는 Linux, Windows (WSL을 통해) 및 MacOS에서 원활하게 작동합니다. 손쉬운 전환 :
df_fireducks = fpd.DataFrame(df_pandas)
친숙한 팬더 API는 부드러운 학습 곡선을 보장합니다. 자동화 된 효율성 :

게으른 평가 및 자동 최적화가 무대 뒤에서 성능을 처리합니다. df_fireducks 유용한 자원

공식 문서 :

FireDucks Docs
start_time = time.time()
result_pandas = df_pandas.groupby('A')['B'].sum()
pandas_time = time.time() - start_time
print(f"Pandas execution time: {pandas_time:.4f} seconds")
github 저장소 :

FireDucks github

NYC 데모 노트 :

NYC 데모 노트북 링크
start_time = time.time()
result_fireducks = df_fireducks.groupby('A')['B'].sum()
fireducks_time = time.time() - start_time
print(f"FireDucks execution time: {fireducks_time:.4f} seconds")
트위터/x :

@fireducksdev
speed_up = pandas_time / fireducks_time
print(f"FireDucks is approximately {speed_up:.2f} times faster than pandas.")

결론 FireDucks는 데이터 분석 효율의 극적인 개선을 제공하여 팬더보다 최대 125 배 빠른 속도를 달성합니다. Pandas API, 게으른 평가 및 자동 최적화와의 호환성은 대규모 데이터 세트로 작업하는 데이터 전문가를위한 강력한 도구입니다. 자주 묻는 질문

Q1. FireDucks는 팬더와 호환 되나요?

A 예, 동일한 API를 사용합니다. Q2. Windows에서 Fireducks를 사용할 수 있습니까? Q3. Fireducks는 Polars 또는 Dask와 어떻게 비교됩니까?

A. Fireducks는 게으른 평가 및 자동 최적화로 인해 성능과 사용 편의성이 뛰어납니다. Q4. Fireducks가 무료입니까?
    A 예, 제한된 기능으로 무료 계획을 사용할 수 있습니다. 유료 계획은 확장 된 기능을 제공합니다.
  • 를 실제 링크로 바꾸는 것을 잊지 마십시오

위 내용은 Goodbye Pandas : Fireducks는 125 배 빠른 성능을 제공합니다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.