首頁  >  文章  >  後端開發  >  如何從具有特定模式的文本文件創建 Pandas DataFrame?

如何從具有特定模式的文本文件創建 Pandas DataFrame?

Barbara Streisand
Barbara Streisand原創
2024-11-02 13:14:02348瀏覽

How to Create a Pandas DataFrame from a Text File with Specific Patterns?

從具有特定模式的文字檔案中建立Pandas DataFrame

您需要從具有以下結構的文字檔案中建構Pandas DataFrame :

有「[edit]」的行表示州,而有「[number]」的行表示區域。任務是根據這些模式分割文件,並為每個區域名稱重複州名稱。

解決方案:

  1. 使用 Pandas 讀取文字檔案' read_csv 函數,由於沒有分隔符,將列名稱指定為「地區名稱」。
  2. 使用字串提取建立一個名為「State」的新列,以從具有「[edit]」的行中捕獲州名稱,並且向前填充值。
  3. 替換從左括號“(”到“區域名稱”列中字串末尾的所有字元。
  4. 過濾掉包含“[edit]的行" 使用基於使用String Contains 建立的遮罩的布林索引。 🎜>

輸出:

以上是如何從具有特定模式的文本文件創建 Pandas DataFrame?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn