使用 Pandas Groupby 连接行中的字符串
为了使用 Pandas 在 groupby 操作中连接多行字符串,重要的是了解 DataFrame 的结构和所需的输出。
在这种情况下,我们有包含按“名称”和“月份”列分组的文本条目的 DataFrame。为了实现所需的串联,我们可以使用“groupby”、“transform”和“apply”函数。
首先,我们按“名称”和“月份”对 DataFrame 进行分组:
df[['name','text','month']].groupby(['name','month'])
接下来,我们使用“transform”应用 lambda 表达式来连接文本条目:
df['text'] = df[['name','text','month']].groupby(['name','month'])['text'].transform(lambda x: ','.join(x))
最后,我们删除重复的行并显示结果:
df[['name','text','month']].drop_duplicates()
或者,我们可以使用“apply”来获得相同的结果:
df.groupby(['name','month'])['text'].apply(lambda x: ','.join(x)).reset_index()
另一种不使用 lambda 的方法是:
df.groupby(['name','month'])['text'].apply(','.join).reset_index()
以上是如何连接 Pandas Groupby 行中的字符串?的详细内容。更多信息请关注PHP中文网其他相关文章!