Heim >Backend-Entwicklung >Python-Tutorial >Wie kann ich mit Pandas bestimmte Arbeitsblätter effizient aus einer Excel-Datei auswählen und lesen?
Effiziente Arbeitsblattauswahl mit Pandas
Bei der Arbeit mit großen Tabellenkalkulationen ist es wichtig, Ihren Code zu optimieren, um unnötiges Laden von Daten zu vermeiden. Diese Frage befasst sich mit dem Problem, bestimmte Arbeitsblätter in einer Excel-Datei mit pd.read_excel() zu lesen, ohne die gesamte Datei mehrmals neu zu laden.
Um dieses Problem zu beheben, liegt die Lösung in der Verwendung von pd.ExcelFile. Diese Klasse liest die Excel-Datei einmal und stellt eine Schnittstelle für den Zugriff auf einzelne Arbeitsblätter bereit. Hier ist ein Beispiel:
xls = pd.ExcelFile('path_to_file.xls') df1 = pd.read_excel(xls, 'Sheet1') df2 = pd.read_excel(xls, 'Sheet2')
Es ist wichtig zu beachten, dass die gesamte Datei während des ExcelFile()-Aufrufs gelesen wird. Nachfolgende Aufrufe von pd.read_excel() mit demselben Dateiobjekt erfordern jedoch nur den Zugriff auf das angegebene Arbeitsblatt.
Das Argument sheet_name in pd.read_excel() akzeptiert eine Zeichenfolge für den Blattnamen und eine Ganzzahl für das Blatt Nummer oder eine Liste von Namen oder Indizes. Der Standardwert ist 0 und gibt das erste Arbeitsblatt an.
Um alle Blätter zu laden, geben Sie sheet_name=None an. Dies gibt ein Wörterbuch zurück, in dem Schlüssel Blattnamen/-indizes und Werte entsprechende Datenrahmen sind.
Das obige ist der detaillierte Inhalt vonWie kann ich mit Pandas bestimmte Arbeitsblätter effizient aus einer Excel-Datei auswählen und lesen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!