首頁 >後端開發 >Python教學 >Pandas 如何有效率地解析 Excel 風格的日期?

Pandas 如何有效率地解析 Excel 風格的日期?

Mary-Kate Olsen
Mary-Kate Olsen原創
2024-11-26 02:56:17644瀏覽

How Can Pandas Efficiently Parse Excel-Style Dates?

用Pandas 解析Excel 樣式日期

處理資料集時,經常會遇到Excel 樣式格式的日期,其中浮點數表示數字自特定紀元日期以來的天數。 Pandas 提供了一種便捷的方法將這些數字轉換為常規日期時間對象,從而實現無縫資料操作和分析。

在提供的內容中概述的情況下,目標是解析包含 Excel 樣式的日期的 XML 文件,如42580.3333333333。為了實現這一點,Pandas 提供了一個使用TimedeltaIndex 的簡單解決方案:

import pandas as pd
import datetime as dt

df = pd.DataFrame({'date': [42580.3333333333, 10023]})

df['real_date'] = pd.TimedeltaIndex(df['date'], unit='d') + dt.datetime(1900, 1, 1)

此程式碼從浮點值建構一個TimedeltaIndex 並將其添加到1900 年1 月1 日的標量日期時間中,有效地將Excel 日期轉換為日期時間

但是,要注意的是,Excel使用的紀元日期與標準日期時間物件略有不同,因此結果日期可能需要相應調整。為了解決這個問題,可以如下修改程式碼:

df['real_date'] = pd.TimedeltaIndex(df['date'], unit='d') + dt.datetime(1899, 12, 30)

這可確保 Excel 樣式日期轉換為正確的日期時間值,從而在 Pandas 框架內實現準確的資料處理和分析。

以上是Pandas 如何有效率地解析 Excel 風格的日期?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn