Heim > Artikel > Backend-Entwicklung > Pandas implementiert die Deduplizierung doppelter Tabellen und konvertiert sie erneut in Tabellen
Das Folgende ist eine Pandas-Methode zum Deduplizieren und erneuten Konvertieren doppelter Tabellen. Sie hat einen guten Referenzwert und ich hoffe, dass sie für alle hilfreich ist. Schauen Sie sich das gemeinsam an
Wenn Python Daten verarbeitet, werden häufig DataFrame und Set verwendet.
train=pd.read_csv('XXX.csv')#读取文件 train=train['item_id']#选择要去重的列 train=set(train)#去重 data=pd.DataFrame(list(train),columns=['item_id'])#因为set是无序的,必须要经过list处理后才能成为DataFrame data.to_csv('xxx.csv',index=False)#保存表格
Denken Sie daran, Pandas zu importieren~
Das obige ist der detaillierte Inhalt vonPandas implementiert die Deduplizierung doppelter Tabellen und konvertiert sie erneut in Tabellen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!