여러 복잡한 기준을 사용하여 Pandas DataFrame에서 데이터를 효율적으로 선택하는 방법은 무엇입니까?-파이썬 튜토리얼-php.cn

집

백엔드 개발

파이썬 튜토리얼

여러 복잡한 기준을 사용하여 Pandas DataFrame에서 데이터를 효율적으로 선택하는 방법은 무엇입니까?

DDD

Dec 02, 2024 pm 08:45 PM

How to Efficiently Select Data from a Pandas DataFrame with Multiple Complex Criteria?

Pandas.DataFrame에서 복잡한 기준으로 선택

데이터 조작 작업에서는 여러 조건이 포함된 복잡한 선택 기준이 자주 발생합니다. Pandas는 이러한 시나리오를 효율적으로 처리하기 위한 방법과 관용구를 제공합니다.

예:

다음 DataFrame을 고려하세요.

import pandas as pd
from random import randint

df = pd.DataFrame({'A': [randint(1, 9) for x in range(10)],
                   'B': [randint(1, 9)*10 for x in range(10)],
                   'C': [randint(1, 9)*100 for x in range(10)]})

문제:

'A'에서 값을 선택하세요. 'B'에 해당하는 값은 50보다 크고 'C'는 900이 아닙니다.

해결책:

열 연산을 적용하여 부울 시리즈 객체를 얻을 수 있습니다. 각 조건에 대해:

df["B"] > 50
(df["B"] > 50) & (df["C"] != 900)

또는 동등하게:

(df["B"] > 50) & ~(df["C"] == 900)

이러한 부울 시리즈를 사용하여 DataFrame에 색인을 생성할 수 있습니다:

df["A"][(df["B"] > 50) & (df["C"] != 900)]

또는 .loc를 사용하여:

df.loc[(df["B"] > 50) & (df["C"] != 900), "A"]

참고:

쓰기 액세스의 경우 다음을 사용하는 것이 좋습니다. 인덱스를 연결하는 대신 .loc를 사용하면 복사본 대신 보기가 발생하여 잠재적인 문제가 발생할 수 있습니다.

위 내용은 여러 복잡한 기준을 사용하여 Pandas DataFrame에서 데이터를 효율적으로 선택하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

Numpy를 사용하여 다차원 배열을 어떻게 생성합니까?Apr 29, 2025 am 12:27 AM

다음 단계를 통해 Numpy를 사용하여 다차원 배열을 만들 수 있습니다. 1) Numpy.array () 함수를 사용하여 NP.Array ([[1,2,3], [4,5,6]]과 같은 배열을 생성하여 2D 배열을 만듭니다. 2) np.zeros (), np.ones (), np.random.random () 및 기타 함수를 사용하여 특정 값으로 채워진 배열을 만듭니다. 3) 서브 어레이의 길이가 일관되고 오류를 피하기 위해 배열의 모양과 크기 특성을 이해하십시오. 4) NP.Reshape () 함수를 사용하여 배열의 모양을 변경하십시오. 5) 코드가 명확하고 효율적인지 확인하기 위해 메모리 사용에주의를 기울이십시오.

Numpy 어레이에서 '방송'의 개념을 설명하십시오.Apr 29, 2025 am 12:23 AM

BroadcastingInnumpyIsamethodtoperformoperationsonArraysoffferentShapesByAutomicallyAligningThem.itsimplifiesCode, enourseadability, andboostsperformance.here'showitworks : 1) smalraysarepaddedwithonestomatchdimenseare

데이터 저장을 위해 목록, Array.Array 및 Numpy Array 중에서 선택하는 방법을 설명하십시오.Apr 29, 2025 am 12:20 AM

forpythondatastorage, chooselistsforflexibilitywithmixeddatatypes, array.arrayformemory-effic homogeneousnumericaldata, andnumpyarraysforadvancednumericalcomputing.listsareversatilebutlessefficipforlargenumericaldatasets.arrayoffersamiddlegro

파이썬 목록을 사용하는 것이 배열을 사용하는 것보다 더 적절한 시나리오의 예를 제시하십시오.Apr 29, 2025 am 12:17 AM

pythonlistsarebetterthanarraysformanagingDiversEdatatypes.1) 1) listscanholdementsofdifferentTypes, 2) thearedynamic, weantEasyAdditionSandremovals, 3) wefferintufiveOperationsLikEslicing, but 4) butiendess-effectorlowerggatesets.

파이썬 어레이에서 요소에 어떻게 액세스합니까?Apr 29, 2025 am 12:11 AM

toaccesselementsInapyThonArray : my_array [2] AccessHetHirdElement, returning3.pythonuseszero 기반 인덱싱 .1) 사용 positiveAndnegativeIndexing : my_list [0] forthefirstelement, my_list [-1] forstelast.2) audeeliciforarange : my_list