Heim  >  Artikel  >  Backend-Entwicklung  >  Pandas-Tutorial: Ausführliche Erklärung, wie diese Bibliothek zum Lesen von Excel-Dateien verwendet wird

Pandas-Tutorial: Ausführliche Erklärung, wie diese Bibliothek zum Lesen von Excel-Dateien verwendet wird

WBOY
WBOYOriginal
2024-01-19 09:45:05442Durchsuche

Pandas-Tutorial: Ausführliche Erklärung, wie diese Bibliothek zum Lesen von Excel-Dateien verwendet wird

Pandas-Tutorial: Detaillierte Erläuterung der Verwendung dieser Bibliothek zum Lesen von Excel-Dateien. Es sind spezifische Codebeispiele erforderlich.

Pandas ist eine häufig verwendete Datenverarbeitungsbibliothek mit vielen leistungsstarken Funktionen, insbesondere in der Datenverarbeitung. Im eigentlichen Datenverarbeitungsprozess ist es oft notwendig, Excel-Dateien einzulesen. In diesem Artikel wird ausführlich erläutert, wie Sie die Pandas-Bibliothek zum Lesen von Excel-Dateien verwenden und spezifische Codebeispiele bereitstellen.

  1. Pandas-Bibliothek importieren

Um die Pandas-Bibliothek zu verwenden, müssen Sie zuerst die Bibliothek importieren:

import pandas as pd

Dabei ist pd der Alias ​​der Pandas-Bibliothek, was die Verwendung von Pandas-bezogenen Methoden erleichtert.

  1. Excel-Dateien lesen

Es ist sehr praktisch, Pandas zum Lesen von Excel-Dateien zu verwenden. Es ist nur eine Codezeile erforderlich:

data = pd.read_excel('file_name.xlsx')

Unter diesen ist file_name.xlsx der Name der Excel-Datei, die sich im befindet Gleiches Verzeichnis wie das Python-Skript Down.

Wenn sich die Excel-Datei nicht im selben Verzeichnis befindet, müssen Sie den vollständigen Pfad angeben, zum Beispiel:

data = pd.read_excel('C:/Users/username/Desktop/file_name.xlsx')

Nachdem Sie die Excel-Datei gelesen haben, können Sie die Daten in der Datei mit den folgenden Methoden anzeigen:

print(data.head())

head ()-Methode zum Anzeigen der Excel-Datei Die ersten 5 Datenzeilen. Wenn Sie mehr Zeilen anzeigen müssen, können Sie die Zahl in Klammern auf die Anzahl der anzuzeigenden Zeilen ändern, zum Beispiel:

print(data.head(10))
  1. Geben Sie die Excel-Tabelle an, die gelesen werden muss

Wenn die Excel-Datei mehrere enthält Tabellen müssen Sie die erforderliche Tabelle angeben, die gelesen werden soll, zum Beispiel:

data = pd.read_excel('file_name.xlsx', sheet_name='Sheet1')

Unter diesen wird sheet_name verwendet, um den Namen der Tabelle anzugeben, die gelesen werden muss. Wenn Sie mehrere Blätter lesen müssen, können Sie Blattname in eine Liste ändern, zum Beispiel:

data = pd.read_excel('file_name.xlsx', sheet_name=['Sheet1', 'Sheet2'])

Auf diese Weise können die Daten von Blatt1 und Blatt2 gleichzeitig ausgelesen und in einem Wörterbuch gespeichert werden.

  1. Bestimmte Zeilen oder Spalten lesen

Wenn die Excel-Tabelle viele Daten enthält, müssen wir manchmal nur einige Zeilen oder Spalten lesen, was mit den loc- und iloc-Methoden von Pandas erreicht werden kann:

Die
  • loc-Methode kann die angegebenen Zeilen- oder Spaltendaten lesen. Das Beispiel lautet wie folgt: Die

    data = pd.read_excel('file_name.xlsx')
    # 读取第 3 行数据
    print(data.loc[2])
    # 读取名称为 'column_name' 的列数据
    print(data.loc[:, 'column_name'])
    # 读取第 3 行、名称为 'column_name' 的数据
    print(data.loc[2, 'column_name'])
  • iloc-Methode kann die angegebenen Zeilen- oder Spaltendaten lesen, muss jedoch den ganzzahligen Positionsindex verwenden. Das Beispiel lautet wie folgt folgt:

    data = pd.read_excel('file_name.xlsx')
    # 读取第 3 行数据
    print(data.iloc[2])
    # 读取第 3 行、第 4 列数据
    print(data.iloc[2, 3])
    # 读取第 2-4 行、第 1-3 列的数据
    print(data.iloc[1:4, 0:3])
  1. Spaltennamen in Excel-Dateien lesen

Beim Lesen von Excel-Dateien müssen Sie manchmal die Spaltennamen in der Excel-Datei abrufen. Sie können die folgende Methode verwenden:

data = pd.read_excel('file_name.xlsx')
# 读取所有列名
print(data.columns.values)
# 读取第 3 列的列名
print(data.columns.values[2])

Unter ihnen , columns.values ​​​​wird verwendet, um die Liste der Spaltennamen zurückzugeben. In Python beginnen Listenindizes bei 0.

  1. Daten in Excel-Dateien schreiben

Neben dem Lesen von Excel-Dateien bietet Pandas auch Methoden zum Schreiben von Daten in Excel-Dateien. Das Beispiel lautet wie folgt:

data = pd.DataFrame({'姓名': ['张三', '李四', '王五'], '年龄': [18, 22, 25]})
# 将数据写入名为 'MySheet' 的表格中
data.to_excel('file_name.xlsx', sheet_name='MySheet', index=False)

Unter anderem wird die Methode to_excel() zum Schreiben von Daten in eine Excel-Datei verwendet. Der erste Parameter ist der Name der Excel-Datei und der zweite Parameter ist der Name der zu schreibenden Tabelle. index=False bedeutet, dass kein Schreiben in die Indexspalte erforderlich ist.

  1. Fazit

In diesem Artikel wird hauptsächlich die Verwendung der Pandas-Bibliothek zum Lesen von Excel-Dateien vorgestellt und spezifische Codebeispiele bereitgestellt. Natürlich verfügt Pandas über viele weitere Funktionen, die in der täglichen Datenverarbeitung weiter verstanden werden können.

Das obige ist der detaillierte Inhalt vonPandas-Tutorial: Ausführliche Erklärung, wie diese Bibliothek zum Lesen von Excel-Dateien verwendet wird. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn