Heim  >  Artikel  >  Backend-Entwicklung  >  Wie man Excel mit Pandas liest

Wie man Excel mit Pandas liest

百草
百草Original
2023-11-22 13:30:272479Durchsuche

So lesen Sie Excel in Pandas: 1. Lesen Sie die gesamte Excel-Datei. 3. Lesen Sie mehrere Arbeitsblätter. 4. Geben Sie fehlende Werte und leere Werte an. Es lohnt sich zu warten. Detaillierte Einführung: 1. Um die gesamte Excel-Datei zu lesen, können Sie die „read_excel()“-Methode von Pandas verwenden. Diese Methode erfordert die Angabe des Dateipfads und des Arbeitsblattnamens Sie benötigen das Lesen bestimmter Arbeitsblätter in Excel-Dateien und mehr.

Wie man Excel mit Pandas liest

Das Betriebssystem dieses Tutorials: Windows 10-System, DELL G3-Computer.

Pandas ist eine beliebte Python-Datenanalysebibliothek, die mehrere Methoden zum Lesen von Excel-Dateien bietet. Im Folgenden finden Sie gängige Methoden zum Lesen von Excel-Dateien mit Pandas:

1. Lesen Sie die gesamte Excel-Datei.

Sie können die read_excel()-Methode von Pandas verwenden, um die gesamte Excel-Datei zu lesen. Dazu müssen Sie den Dateipfad und den Arbeitsblattnamen angeben.

Beispielcode:

import pandas as pd  
  
df = pd.read_excel('file_path.xlsx', sheet_name='Sheet1')  # 读取名为'Sheet1'的工作表

2. Lesen Sie das angegebene Arbeitsblatt

Wenn Sie nur ein bestimmtes Arbeitsblatt in der Excel-Datei lesen müssen, können Sie den Parameter sheet_name in der Methode read_excel() angeben.

Beispielcode:

import pandas as pd  
  
df = pd.read_excel('file_path.xlsx', sheet_name='Sheet2')  # 读取名为'Sheet2'的工作表

3. Mehrere Arbeitsblätter lesen

Wenn Sie mehrere Arbeitsblätter in einer Excel-Datei lesen möchten, können Sie den Parameter sheet_name in der Methode read_excel() verwenden, um die Namen mehrerer Arbeitsblätter anzugeben Datenrahmenobjekte.

Beispielcode:

import pandas as pd  
  
dfs = pd.read_excel('file_path.xlsx', sheet_name=['Sheet1', 'Sheet2'])  # 获取名为'Sheet1'和'Sheet2'的两个数据框对象

4. Geben Sie Spaltennamen und Indexspalten an

Standardmäßig behandelt die Methode read_excel() die erste Zeile als Spaltennamen und die erste Spalte als Indexspalte. Wenn Sie Spaltennamen und Indexspalten angeben möchten, können Sie die Parameter header und index_col verwenden.

Beispielcode:

import pandas as pd  
  
df = pd.read_excel('file_path.xlsx', header=1, index_col=0)  # 将第一行视为列名,将第一列视为索引列

5. Umgang mit fehlenden und leeren Werten

Standardmäßig behandelt die Methode read_excel() leere Zellen als NaN-Werte. Wenn Sie andere Werte für die Verarbeitung von Nullwerten angeben möchten, können Sie den Parameter na_values ​​verwenden. Zusätzlich können fehlende Werte mit der Methode fillna() aufgefüllt werden.

Beispielcode:

import pandas as pd  
  
df = pd.read_excel('file_path.xlsx', na_values='N/A')  # 将空单元格视为NaN值,但将'N/A'视为一个特殊值  
df = df.fillna(0)  # 填充缺失值为0

Das obige ist der detaillierte Inhalt vonWie man Excel mit Pandas liest. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn