데이터 분석에서는 두 날짜 또는 타임스탬프 간의 시차를 계산해야 하는 경우가 많습니다. Python의 인기 있는 데이터 분석 라이브러리인 Pandas는 이러한 계산을 위한 편리한 방법을 제공합니다. 다만, 시차가 24시간을 초과하는 경우 결과에는 일수가 구성요소로 포함될 수 있습니다. 이 문서에서는 이 결과를 시간과 분만 표시하도록 변환하는 방법에 대해 설명합니다.
fromdate와 todate라는 두 개의 열이 있는 다음 예제 데이터 프레임을 고려하세요.
import pandas as pd data = {'todate': [pd.Timestamp('2014-01-24 13:03:12.050000'), pd.Timestamp('2014-01-27 11:57:18.240000'), pd.Timestamp('2014-01-23 10:07:47.660000')], 'fromdate': [pd.Timestamp('2014-01-26 23:41:21.870000'), pd.Timestamp('2014-01-27 15:38:22.540000'), pd.Timestamp('2014-01-23 18:50:41.420000')]} df = pd.DataFrame(data)
둘 사이의 차이를 계산하려면 날짜의 경우 - 연산자를 사용할 수 있습니다.
df['diff'] = df['fromdate'] - df['todate']
이 작업을 수행하면 datetime.timedelta 개체가 포함된 diff 열이 생성됩니다. 그러나 이러한 객체에는 다음 출력에서 볼 수 있듯이 일수가 구성 요소로 포함될 수 있습니다.
todate fromdate diff 0 2014-01-24 13:03:12.050 2014-01-26 23:41:21.870 2 days 10:38:09.820000 1 2014-01-27 11:57:18.240 2014-01-27 15:38:22.540 0 days 03:41:04.300000 2 2014-01-23 10:07:47.660 2014-01-23 18:50:41.420 0 days 08:42:53.760000
이 결과를 시간과 분으로만 변환하려면 'timedelta64[ h]' 인수:
(df.fr-df.to).astype('timedelta64[h]')
이 코드는 시차를 시간으로 변환하여 다음을 산출합니다. 출력:
0 58 1 3 2 8 dtype: float64
이 방법을 적용하면 차이가 24시간을 초과하는지 여부에 관계없이 두 날짜 또는 타임스탬프 간의 시차를 시간과 분 단위로 얻을 수 있습니다.
위 내용은 두 Pandas 열 간의 시간 차이를 시간과 분 단위로만 계산하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!