在 pandas 中,数据操作通常涉及组合列以获得有意义的见解。当我们需要合并文本列以创建新的文本列时,就会出现这样的情况。
考虑以下包含两个文本列“年份”和“季度”的数据框:
Year quarter 2000 q2 2001 q3
我们的目标是创建一个名为“period”的新列,它将“Year”和“quarter”列组合起来,以获得诸如“2000q2”和"2001q3."
要实现此目的,如果“Year”和“quarter”列都是字符串,我们可以直接连接它们:
df["period"] = df["Year"].astype(str) + df["quarter"]
但是,如果其中一列或两列都不是字符串字符串,我们必须在连接之前将它们转换为字符串。例如:
df["period"] = df["Year"].astype(str) + df["quarter"]
执行此操作时必须小心 NaN 值,因为它们可能会导致意外结果。
或者,如果需要连接多个字符串列, agg 方法可能很有用:
df['period'] = df[['Year', 'quarter', ...]].agg('-'.join, axis=1)
在这种情况下,“-”用作分隔符,但您可以自定义它根据需要。
以上是如何组合 Pandas DataFrame 中的文本列来创建新列?的详细内容。更多信息请关注PHP中文网其他相关文章!