将 Pandas 中的字符串转换为日期时间格式
在数据分析中,处理表示日期和时间的字符串是一个常见的挑战。为了提取有意义的见解,将这些字符串转换为合适的日期时间格式至关重要。
将字符串转换为日期时间
Pandas 提供了一种便捷的方法 to_datetime(),用于将字符串转换为日期时间格式。它自动检测输入字符串的格式并将其转换为 datetime64 对象。例如,考虑一个包含 I_DATE 列的数据框,其中包含表示日期和时间的字符串:
df['I_DATE'] = ['28-03-2012 2:15:00 PM', '28-03-2012 2:17:28 PM', '28-03-2012 2:50:50 PM']
要将 I_DATE 转换为日期时间格式,只需使用 to_datetime():
df['I_DATE'] = pd.to_datetime(df['I_DATE'])
输出将是一列 datetime64 对象:
0 2012-03-28 14:15:00 1 2012-03-28 14:17:28 2 2012-03-28 14:50:50 Name: I_DATE, dtype: datetime64[ns]
访问日期组件
将字符串转换为日期时间后,您可以使用 dt 访问器访问日期和时间的特定组件。例如,要提取日期组件:
df['I_DATE'].dt.date
返回一列仅表示日期的 datetime64[ns] 对象。同样,您可以使用 dt.time 检索时间部分。
根据日期范围筛选行
要根据日期范围筛选行,您可以使用字符串操作>和
df[(df['I_DATE'] > '2015-02-04') & (df['I_DATE'] < '2015-02-10')]
这将返回一个数据帧,其中仅包含 I_DATE 列在指定日期之间的行。
以上是Pandas 如何高效地将字符串日期转换为 DateTime 对象并方便基于日期的过滤?的详细内容。更多信息请关注PHP中文网其他相关文章!