>백엔드 개발 >파이썬 튜토리얼 >Pandas DataFrame에서 누락된 날짜를 0으로 채우는 방법은 무엇입니까?

Pandas DataFrame에서 누락된 날짜를 0으로 채우는 방법은 무엇입니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-12-05 18:03:15862검색

How to Fill Missing Dates in a Pandas DataFrame with Zero Counts?

Pandas Dataframe에 누락된 날짜 추가

시계열 데이터로 작업할 때 특정 날짜에 해당하는 이벤트가 없는 상황이 발생할 수 있습니다. 이러한 데이터를 구성하면 서로 다른 계열 간에 날짜 범위가 일치하지 않는 경우 불일치가 발생할 수 있습니다.

이 문제를 해결하는 한 가지 방법은 누락된 날짜를 0으로 데이터 프레임에 추가하는 것입니다. 이렇게 하면 이벤트가 없는 날짜에도 전체 기간을 나타내는 완전한 그래프가 보장됩니다.

이를 달성하려면 Series.reindex 방법을 활용할 수 있습니다. 이 방법을 사용하면 계열의 색인을 조정하여 다른 색인과 일치시킬 수 있습니다. 귀하의 경우에는 원하는 날짜 범위를 기준으로 시리즈를 다시 색인화하여 해당 범위 내의 모든 날짜를 포함하도록 합니다. 누락된 날짜는 0으로 채워집니다.

다음은 이 접근 방식을 보여주는 예입니다.

import pandas as pd

idx = pd.date_range('09-01-2013', '09-30-2013')

s = pd.Series({'09-02-2013': 2,
               '09-03-2013': 10,
               '09-06-2013': 5,
               '09-07-2013': 1})

s.index = pd.DatetimeIndex(s.index)

s = s.reindex(idx, fill_value=0)

print(s)

이 코드는 다음 출력을 생성합니다.

2013-09-01     0
2013-09-02     2
2013-09-03    10
2013-09-04     0
2013-09-05     0
2013-09-06     5
2013-09-07     1
...

알 수 있듯이 누락된 날짜(09-04 및 09-05)가 0 카운트인 계열에 추가되어 완전한 그래프가 생성되었습니다. 30일 중. 재색인 방법을 사용하면 날짜 범위 불일치를 효과적으로 처리하고 시계열 데이터에 대한 포괄적인 시각화를 생성할 수 있습니다.

위 내용은 Pandas DataFrame에서 누락된 날짜를 0으로 채우는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.