首页 >后端开发 >Python教程 >如何组合 Pandas DataFrame 中的文本列来创建新列?

如何组合 Pandas DataFrame 中的文本列来创建新列?

Linda Hamilton
Linda Hamilton原创
2024-12-18 03:48:10157浏览

How Can I Combine Text Columns in a Pandas DataFrame to Create a New Column?

组合文本列以在 Pandas DataFrame 中创建新列

在 pandas 中,数据操作通常涉及组合列以获得有意义的见解。当我们需要合并文本列以创建新的文本列时,就会出现这样的情况。

考虑以下包含两个文本列“年份”和“季度”的数据框:

Year  quarter
2000       q2
2001       q3

我们的目标是创建一个名为“period”的新列,它将“Year”和“quarter”列组合起来,以获得诸如“2000q2”和"2001q3."

要实现此目的,如果“Year”和“quarter”列都是字符串,我们可以直接连接它们:

df["period"] = df["Year"].astype(str) + df["quarter"]

但是,如果其中一列或两列都不是字符串字符串,我们必须在连接之前将它们转换为字符串。例如:

df["period"] = df["Year"].astype(str) + df["quarter"]

执行此操作时必须小心 NaN 值,因为它们可能会导致意外结果。

或者,如果需要连接多个字符串列, agg 方法可能很有用:

df['period'] = df[['Year', 'quarter', ...]].agg('-'.join, axis=1)

在这种情况下,“-”用作分隔符,但您可以自定义它根据需要。

以上是如何组合 Pandas DataFrame 中的文本列来创建新列?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn