處理資料集時,經常會遇到Excel 樣式格式的日期,其中浮點數表示數字自特定紀元日期以來的天數。 Pandas 提供了一種便捷的方法將這些數字轉換為常規日期時間對象,從而實現無縫資料操作和分析。
在提供的內容中概述的情況下,目標是解析包含 Excel 樣式的日期的 XML 文件,如42580.3333333333。為了實現這一點,Pandas 提供了一個使用TimedeltaIndex 的簡單解決方案:
import pandas as pd import datetime as dt df = pd.DataFrame({'date': [42580.3333333333, 10023]}) df['real_date'] = pd.TimedeltaIndex(df['date'], unit='d') + dt.datetime(1900, 1, 1)
此程式碼從浮點值建構一個TimedeltaIndex 並將其添加到1900 年1 月1 日的標量日期時間中,有效地將Excel 日期轉換為日期時間
但是,要注意的是,Excel使用的紀元日期與標準日期時間物件略有不同,因此結果日期可能需要相應調整。為了解決這個問題,可以如下修改程式碼:
df['real_date'] = pd.TimedeltaIndex(df['date'], unit='d') + dt.datetime(1899, 12, 30)
這可確保 Excel 樣式日期轉換為正確的日期時間值,從而在 Pandas 框架內實現準確的資料處理和分析。
以上是Pandas 如何有效率地解析 Excel 風格的日期?的詳細內容。更多資訊請關注PHP中文網其他相關文章!