使用Pandas Groupby 連接行中的字串
為了使用Pandas 在groupby 操作中連接多行字串,重要的是了解字串DataFrame 的結構和所需的輸出。
在這種情況下,我們有包含按「名稱」和「月份」列分組的文字條目的 DataFrame。為了實現所需的串聯,我們可以使用「groupby」、「transform」和「apply」函數。
首先,我們按「名稱」和「月份」將 DataFrame 分組:
df[['name','text','month']].groupby(['name','month'])
接下來,我們使用「transform」來應用 lambda表達式來連接文字項目:
df['text'] = df[['name','text','month']].groupby(['name','month'])['text'].transform(lambda x: ','.join(x))
最後,我們刪除重複的行並顯示結果:
df[['name','text','month']].drop_duplicates()
或者,我們可以使用「apply」來獲得相同的結果:
df.groupby(['name','month'])['text'].apply(lambda x: ','.join(x)).reset_index()
另一個不使用lambda 的方法是:
df.groupby(['name','month'])['text'].apply(','.join).reset_index()
以上是如何連接 Pandas Groupby 行中的字串?的詳細內容。更多資訊請關注PHP中文網其他相關文章!