首頁 >後端開發 >Python教學 >如何有效地連接 Pandas DataFrame 中的文字列?

如何有效地連接 Pandas DataFrame 中的文字列?

Mary-Kate Olsen
Mary-Kate Olsen原創
2024-12-13 18:56:15597瀏覽

How Can I Efficiently Concatenate Text Columns in a Pandas DataFrame?

在Pandas DataFrame 中連接文本列的有效技術

在資料操作領域,經常需要將多個文本列組合成一個單一的、有凝聚力的列。讓我們探討一個涉及具有「年份」和「季度」列的 DataFrame 的常見場景,其中目標是建立一個代表組合值的新「週期」列。

為了實現這一目標,我們採用以下策略:

直接連接(字串列)

如果都是「年份」和' quarter'列是字串類型,我們可以直接使用以下方式連接它們:

df["period"] = df["Year"] + df["quarter"]

類型轉換(非字串列)

如果columns不是字串類型,我們必須先將它們轉換為strings:

df["period"] = df["Year"].astype(str) + df["quarter"]

注意:在連接過程中小心處理 NaN。

多個字串列的聚合

處理時對於多個字串列,我們可以利用「agg」函數:

df['period'] = df[['Year', 'quarter', ...]].agg('-'.join, axis=1)

這裡,「-」充當列值之間的分隔符號。

透過採用這些技術,您可以輕鬆地組合 Pandas DataFrame 中的文字列,為無縫資料處理和分析。

以上是如何有效地連接 Pandas DataFrame 中的文字列?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn