Heim >Backend-Entwicklung >Python-Tutorial >Pandas implementiert die Deduplizierung doppelter Tabellen und konvertiert sie erneut in Tabellen

Pandas implementiert die Deduplizierung doppelter Tabellen und konvertiert sie erneut in Tabellen

不言Original: 2018-04-18 15:47:283112Durchsuche

Das Folgende ist eine Pandas-Methode zum Deduplizieren und erneuten Konvertieren doppelter Tabellen. Sie hat einen guten Referenzwert und ich hoffe, dass sie für alle hilfreich ist. Schauen Sie sich das gemeinsam an

Wenn Python Daten verarbeitet, werden häufig DataFrame und Set verwendet.

train=pd.read_csv(&#39;XXX.csv&#39;)#读取文件 
train=train[&#39;item_id&#39;]#选择要去重的列 
train=set(train)#去重 
data=pd.DataFrame(list(train),columns=[&#39;item_id&#39;])#因为set是无序的，必须要经过list处理后才能成为DataFrame 
data.to_csv(&#39;xxx.csv&#39;,index=False)#保存表格

Denken Sie daran, Pandas zu importieren~

Das obige ist der detaillierte Inhalt vonPandas implementiert die Deduplizierung doppelter Tabellen und konvertiert sie erneut in Tabellen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme：

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Vorheriger Artikel：Schreiben Sie einen einfachen Webcrawler in Python, um Videos aufzunehmenNächster Artikel：Schreiben Sie einen einfachen Webcrawler in Python, um Videos aufzunehmen

In Verbindung stehende Artikel

Mehr sehen