두 날짜 사이의 DataFrame 행 선택
소개
시계열 데이터 작업 시 , 날짜 범위를 기준으로 특정 행을 선택해야 하는 경우가 많습니다. 이 문서에서는 Pandas DataFrames에서 이를 달성하기 위한 두 가지 방법을 살펴봅니다.
방법 1: 부울 마스크
날짜 열이 dtype이 포함된 시리즈인지 확인하세요. datetime64[ns]:
df['date'] = pd.to_datetime(df['date'])
시작 날짜와 종료 날짜가 포함된 비교 연산자를 사용하여 부울 마스크를 만듭니다.
mask = (df['date'] > start_date) & (df['date'] <= end_date)
선택 하위 DataFrame을 사용하여 마스크:
df.loc[mask]
방법 2: DatetimeIndex
날짜 열을 색인:
df = df.set_index(['date'])
날짜 범위를 사용하여 DataFrame 분할:
df.loc[start_date:end_date]
예
날짜 열이 있는 DataFrame을 생각해 보세요. 다음 코드는 부울 마스크 방법을 사용하여 '2000-06-01'과 '2000-06-10' 사이의 행을 선택합니다.
import pandas as pd df = pd.DataFrame({ 'date': pd.date_range('2000-1-1', periods=200, freq='D'), 'value': np.random.rand(200) }) mask = (df['date'] > '2000-06-01') & (df['date'] <= '2000-06-10') result_df = df[mask]
결과에는 6월 1일부터 10일까지의 행이 포함됩니다. 2000.
비교
위 내용은 Pandas의 특정 날짜 범위 내에서 DataFrame 행을 효율적으로 선택하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!