首頁 >後端開發 >Python教學 >如何使用 Pandas 有效率地從大型 Excel 檔案載入特定工作表?

如何使用 Pandas 有效率地從大型 Excel 檔案載入特定工作表?

DDD
DDD原創
2024-11-29 01:36:12671瀏覽

How Can I Efficiently Load Specific Worksheets from a Large Excel File with Pandas?

使用Pandas 有效率地從工作簿載入特定工作表

Pandas 的pd.read_excel() 函式是讀取Excel 工作簿強大工具。但是,在處理包含多個工作表的大檔案時,載入整個工作簿可能會效率低下,尤其是當您只需要幾個特定工作表中的資料時。

使用pd.read_excel( 了解載入過程) )

在特定工作表上使用pd.read_excel() 時,似乎整個工作簿都已載入記憶體中。這是因為 pandas 內部使用 ExcelFile 物件來表示工作簿。 ExcelFile 物件在初始化期間解析整個文件,無論指定哪個工作表。

高效載入特定工作表

要最佳化載入過程,請考慮使用 pd直接.ExcelFile物件。透過使用工作簿路徑實例化 ExcelFile 對象,您可以存取特定工作表,而無需重新載入整個檔案。

例如:

此方法在建立過程中只會載入整個工作簿一次ExcelFile 物件的。後續呼叫 pd.read_excel() 將從指定工作表中檢索數據,而不會產生重新載入檔案的開銷。

載入多個工作表

此外,您可以向 pd.read_excel() 指定工作表名稱或索引清單同時載入多個工作表。這將傳回一個字典,其中鍵是工作表名稱或索引,值是相應的資料框。

例如:

載入所有工作表

如果需要載入工作簿中的所有工作表,請將sheet_name參數設為無:

以上是如何使用 Pandas 有效率地從大型 Excel 檔案載入特定工作表?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn