在不使用Pandas 重新載入整個檔案的情況下存取Excel 工作簿中的特定工作表
處理大型Excel 檔案時,載入效率可能會很低當只需要幾個工作表時,可以多次查看整個工作簿。利用 pd.read_excel() 函數,可以選擇性地載入特定工作表,而無需重新載入整個檔案。
要實現此目的,請考慮利用 pd.ExcelFile 類別。其實作方式如下:
import pandas as pd # Create an instance of pd.ExcelFile xls = pd.ExcelFile('path_to_file.xls') # Read sheet1 and sheet2 from the Excel file df1 = pd.read_excel(xls, 'Sheet1') df2 = pd.read_excel(xls, 'Sheet2')
在這種情況下,整個 Excel 檔案在 ExcelFile() 呼叫期間只會載入一次。隨後,每個 pd.read_excel() 呼叫都會針對特定的工作表,從而避免不必要的重新載入。
需要注意的是,pd.read_excel() 中的sheet_name 參數接受一系列值:工作表的名稱、其索引(例如,0、1...)、工作表名稱或索引的列表,或無。如果提供了列表,則傳回以工作表名稱/索引作為鍵、以對應的資料框作為值的字典。預設行為是取得第一個工作表 (sheet_name=0)。
透過使用 None 作為sheet_name,工作簿中的所有工作表都可以作為 {sheet_name: dataframe} 字典載入。當需要存取多個工作表時,此方法非常理想,無需重複載入檔案。
以上是如何使用 Pandas 存取特定的 Excel 工作表而不重新載入整個文件?的詳細內容。更多資訊請關注PHP中文網其他相關文章!