Heim > Artikel > Backend-Entwicklung > CSV-Dateien mit Pandas lesen
Der folgende Artikel zeigt Ihnen, wie Sie mit Pandas CSV-Dateien durch Angabe von Spalten lesen können. Er hat einen guten Referenzwert und ich hoffe, dass er für alle hilfreich ist. Schauen wir uns das gemeinsam an
Laut Anleitung habe ich die ersten Datenzeilen in der CSV-Datei gelesen und sofort darüber nachgedacht, ob es möglich ist, die ersten Datenspalten zu lesen. Nach vielen Versuchen habe ich endlich eine Methode gefunden.
Der Grund, warum ich die ersten paar Spalten lesen möchte, ist, dass in einer CSV-Datei, die ich habe, in den nächsten paar Spalten zufällig keine Daten verfügbar sind, diese aber immer vorhanden sind. Die Originaldaten lauten wie folgt:
GreydeMac-mini:chapter06 greyzhang$ cat data.csv
1,name_01,coment_01,,,, 2,name_02,coment_02,,,, 3,name_03,coment_03,,,, 4,name_04,coment_04,,,, 5,name_05,coment_05,,,, 6,name_06,coment_06,,,, 7,name_07,coment_07,,,, 8,name_08,coment_08,,,, 9,name_09,coment_09,,,, 10,name_10,coment_10,,,, 11,name_11,coment_11,,,, 12,name_12,coment_12,,,, 13,name_13,coment_13,,,, 14,name_14,coment_14,,,, 15,name_15,coment_15,,,, 16,name_16,coment_16,,,, 17,name_17,coment_17,,,, 18,name_18,coment_18,,,, 19,name_19,coment_19,,,, 20,name_20,coment_20,,,, 21,name_21,coment_21,,,,
Wenn Sie Pandas zum Lesen aller Daten verwenden, werden beim Drucken die folgenden Ergebnisse angezeigt:
In [41]: data = pd.read_csv('data .csv ')
In [42]: data Out[42]: 1 name_01 coment_01 Unnamed: 3 Unnamed: 4 Unnamed: 5 Unnamed: 6 0 2 name_02 coment_02 NaN NaN NaN NaN 1 3 name_03 coment_03 NaN NaN NaN NaN 2 4 name_04 coment_04 NaN NaN NaN NaN 3 5 name_05 coment_05 NaN NaN NaN NaN 4 6 name_06 coment_06 NaN NaN NaN NaN 5 7 name_07 coment_07 NaN NaN NaN NaN 6 8 name_08 coment_08 NaN NaN NaN NaN 7 9 name_09 coment_09 NaN NaN NaN NaN 8 10 name_10 coment_10 NaN NaN NaN NaN 9 11 name_11 coment_11 NaN NaN NaN NaN 10 12 name_12 coment_12 NaN NaN NaN NaN 11 13 name_13 coment_13 NaN NaN NaN NaN 12 14 name_14 coment_14 NaN NaN NaN NaN 13 15 name_15 coment_15 NaN NaN NaN NaN 14 16 name_16 coment_16 NaN NaN NaN NaN 15 17 name_17 coment_17 NaN NaN NaN NaN 16 18 name_18 coment_18 NaN NaN NaN NaN 17 19 name_19 coment_19 NaN NaN NaN NaN 18 20 name_20 coment_20 NaN NaN NaN NaN 19 21 name_21 coment_21 NaN NaN NaN NaN
sagte, dass dies für mich keine Hindernisse im Lernprozess mit sich bringen wird, sondern im Befehl Nachdem ich lange in der Terminaloberfläche geblieben bin, mag ich immer einen leicht erfrischenden Stil. Die Verwendung des read_csv-Parameters usecols kann diese Verwirrung bis zu einem gewissen Grad reduzieren.
In [45]: data = pd.read_csv('data.csv',usecols=[0,1,2,3])
In [46]: data Out[46]: 1 name_01 coment_01 Unnamed: 3 0 2 name_02 coment_02 NaN 1 3 name_03 coment_03 NaN 2 4 name_04 coment_04 NaN 3 5 name_05 coment_05 NaN 4 6 name_06 coment_06 NaN 5 7 name_07 coment_07 NaN 6 8 name_08 coment_08 NaN 7 9 name_09 coment_09 NaN 8 10 name_10 coment_10 NaN 9 11 name_11 coment_11 NaN 10 12 name_12 coment_12 NaN 11 13 name_13 coment_13 NaN 12 14 name_14 coment_14 NaN 13 15 name_15 coment_15 NaN 14 16 name_16 coment_16 NaN 15 17 name_17 coment_17 NaN 16 18 name_18 coment_18 NaN 17 19 name_19 coment_19 NaN 18 20 name_20 coment_20 NaN 19 21 name_21 coment_21 NaN
Um die „Grenze“ der Daten erkennen zu können, wird beim Lesen die erste Spalte ungültiger Daten angezeigt. Bei normaler Verwendung möchten wir möglicherweise die Informationen der letzten Spalte im obigen Ergebnis entfernen. Dann müssen wir nur die Spaltennummer der letzten Spalte in den Parametern entfernen.
In [47]: data = pd.read_csv('data.csv',usecols=[0,1,2])
In [48]: data Out[48]: 1 name_01 coment_01 0 2 name_02 coment_02 1 3 name_03 coment_03 2 4 name_04 coment_04 3 5 name_05 coment_05 4 6 name_06 coment_06 5 7 name_07 coment_07 6 8 name_08 coment_08 7 9 name_09 coment_09 8 10 name_10 coment_10 9 11 name_11 coment_11 10 12 name_12 coment_12 11 13 name_13 coment_13 12 14 name_14 coment_14 13 15 name_15 coment_15 14 16 name_16 coment_16 15 17 name_17 coment_17 16 18 name_18 coment_18 17 19 name_19 coment_19 18 20 name_20 coment_20 19 21 name_21 coment_21
Verwandte Empfehlungen:
Verwenden Sie Pandas, um die ersten paar Zeilen zu lesen, die in der CSV-Datei angegeben sind
Das obige ist der detaillierte Inhalt vonCSV-Dateien mit Pandas lesen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!