使用 Pandas 进行高效工作表选择
使用大型电子表格时,优化代码以避免不必要的数据加载至关重要。此问题解决了使用 pd.read_excel() 读取 Excel 文件中的特定工作表而无需多次重新加载整个文件的问题。
要解决此问题,解决方案在于使用 pd.ExcelFile。此类读取 Excel 文件一次,并提供访问各个工作表的接口。下面是一个示例:
xls = pd.ExcelFile('path_to_file.xls') df1 = pd.read_excel(xls, 'Sheet1') df2 = pd.read_excel(xls, 'Sheet2')
需要注意的是,在 ExcelFile() 调用期间会读取整个文件。但是,后续使用同一文件对象调用 pd.read_excel() 只需要访问指定的工作表。
pd.read_excel() 中的sheet_name 参数接受工作表名称的字符串、工作表的整数数字,或名称或索引的列表。默认为 0,表示第一个工作表。
要加载所有工作表,请指定sheet_name=None。这将返回一个字典,其中键是工作表名称/索引,值是相应的数据框。
以上是如何使用 Pandas 高效地从 Excel 文件中选择和读取特定工作表?的详细内容。更多信息请关注PHP中文网其他相关文章!