Heim >Backend-Entwicklung >Python-Tutorial >Wie kann ich mit Pandas auf bestimmte Excel-Arbeitsblätter zugreifen, ohne die gesamte Datei neu laden zu müssen?

Wie kann ich mit Pandas auf bestimmte Excel-Arbeitsblätter zugreifen, ohne die gesamte Datei neu laden zu müssen?

Barbara Streisand
Barbara StreisandOriginal
2024-12-06 15:42:15840Durchsuche

How Can I Access Specific Excel Worksheets Without Reloading the Entire File Using Pandas?

Mit Pandas auf bestimmte Arbeitsblätter in einer Excel-Arbeitsmappe zugreifen, ohne die gesamte Datei neu laden zu müssen

Beim Umgang mit großen Excel-Dateien kann das Laden ineffizient sein Wenn nur wenige Arbeitsblätter erforderlich sind, können Sie die gesamte Arbeitsmappe mehrmals durchsuchen. Mithilfe der Funktion pd.read_excel() ist es möglich, bestimmte Arbeitsblätter selektiv zu laden, ohne die gesamte Datei neu laden zu müssen.

Um dies zu erreichen, sollten Sie die Nutzung der pd.ExcelFile-Klasse in Betracht ziehen. So geht's:

import pandas as pd

# Create an instance of pd.ExcelFile
xls = pd.ExcelFile('path_to_file.xls')

# Read sheet1 and sheet2 from the Excel file
df1 = pd.read_excel(xls, 'Sheet1')
df2 = pd.read_excel(xls, 'Sheet2')

In diesem Szenario wird die gesamte Excel-Datei nur einmal während des ExcelFile()-Aufrufs geladen. Anschließend zielt jeder Aufruf von pd.read_excel() auf ein bestimmtes Blatt ab, wodurch unnötiges Neuladen vermieden wird.

Es ist wichtig zu beachten, dass das Argument sheet_name in pd.read_excel() einen Wertebereich akzeptiert: den Namen des Blattes, seinen Index (z. B. 0, 1...), eine Liste von Blattnamen oder Indizes oder Keine. Wenn eine Liste bereitgestellt wird, wird ein Wörterbuch mit Blattnamen/Indizes als Schlüssel und entsprechenden Datenrahmen als Werten zurückgegeben. Das Standardverhalten besteht darin, das erste Blatt (Blattname=0) abzurufen.

Durch die Verwendung von None als Blattname können alle Blätter in der Arbeitsmappe als {Blattname: Datenrahmen}-Wörterbuch geladen werden. Dieser Ansatz ist ideal, wenn auf mehrere Blätter zugegriffen werden muss, sodass kein wiederholtes Laden von Dateien erforderlich ist.

Das obige ist der detaillierte Inhalt vonWie kann ich mit Pandas auf bestimmte Excel-Arbeitsblätter zugreifen, ohne die gesamte Datei neu laden zu müssen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn