首页 >后端开发 >Python教程 >如何使用 pd.to_datetime() 有效组合 Pandas 中的日期和时间列?

如何使用 pd.to_datetime() 有效组合 Pandas 中的日期和时间列?

DDD
DDD原创
2024-11-16 14:01:03430浏览

How to efficiently combine date and time columns in Pandas with pd.to_datetime()?

将 Pandas 中的日期和时间列与 pd.to_datetime() 组合

在 Pandas 中处理日期和时间数据时,通常有必要将单独的列组合成单个日期时间对象。一种方法是使用 pd.to_datetime() 函数。

问题陈述

考虑一个包含“日期”和“时间”列的数据框,如下所示如下所示:

Date      Time
01-06-2013  23:00:00
02-06-2013  01:00:00
02-06-2013  21:00:00
02-06-2013  22:00:00
02-06-2013  23:00:00
03-06-2013  01:00:00
03-06-2013  21:00:00
03-06-2013  22:00:00
03-06-2013  23:00:00
04-06-2013  01:00:00

我们的目标是将这两列合并为一个“日期和”

使用字符串连接的解决方案

一种方法是将“日期”和“时间”列连接为字符串,然后将结果字符串转换为使用 pd.to_datetime() 的 datetime 对象:

result = pd.to_datetime(df['Date'] + ' ' + df['Time'])

这会将连接的字符串转换为一系列日期时间对象。

解决方案使用 format 参数

或者,您可以使用 pd.to_datetime() 的 format 参数来指定组合的确切格式string:

result = pd.to_datetime(df['Date'] + df['Time'], format='%m-%d-%Y %H:%M:%S')

这种方法比前一种方法更快,特别是在处理大型数据时

性能比较

使用 %%timeit 魔法命令,我们可以比较两种方法的性能:

df = pd.concat([df for _ in range(1000000)]).reset_index(drop=True)

%timeit pd.to_datetime(df['Date'] + ' ' + df['Time'])

%timeit pd.to_datetime(df['Date'] + df['Time'], format='%m-%d-%Y %H:%M:%S')

第二种对于大型数据集,使用格式参数的方法明显更快。

以上是如何使用 pd.to_datetime() 有效组合 Pandas 中的日期和时间列?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn