在大型csv 檔案中,使用者經常需要將列中的文字資料拆分為單獨的行以便於分析和數據操縱。使用 pandas 或 Python 時,可以採用多種方法來實現此目標。
一種常見的方法是利用所需列上的 split 方法,根據指定的分隔符號對文字進行細分。例如,要使用空格和冒號拆分名為「Seatblocks」的列,可以使用以下語法:
s = df['Seatblocks'].str.split(' ').apply(Series, 1).stack() s.index = s.index.droplevel(-1) # align with df's index s.name = 'Seatblocks' # assign a name for joining
拆分列後,可以使用join 方法將其與原始DataFrame 重新連接:
del df['Seatblocks'] df.join(s)
或者,要為每個冒號分隔的字串建立單獨的列,可以使用以下程式碼應用:
df.join(s.apply(lambda x: Series(x.split(':'))))
透過使用這些方法,使用者可以有效地將文字數據拆分為多行,從而在程式設計過程中進行更精細的分析和資料操作。
以上是如何在 pandas DataFrame 中將一列中的文字拆分為多行?的詳細內容。更多資訊請關注PHP中文網其他相關文章!