Heim  >  Artikel  >  Backend-Entwicklung  >  Pandas implementiert die Deduplizierung doppelter Tabellen und konvertiert sie erneut in Tabellen

Pandas implementiert die Deduplizierung doppelter Tabellen und konvertiert sie erneut in Tabellen

不言
不言Original
2018-04-18 15:47:282962Durchsuche

Das Folgende ist eine Pandas-Methode zum Deduplizieren und erneuten Konvertieren doppelter Tabellen. Sie hat einen guten Referenzwert und ich hoffe, dass sie für alle hilfreich ist. Schauen Sie sich das gemeinsam an

Wenn Python Daten verarbeitet, werden häufig DataFrame und Set verwendet.

train=pd.read_csv('XXX.csv')#读取文件 
train=train['item_id']#选择要去重的列 
train=set(train)#去重 
data=pd.DataFrame(list(train),columns=['item_id'])#因为set是无序的,必须要经过list处理后才能成为DataFrame 
data.to_csv('xxx.csv',index=False)#保存表格

Denken Sie daran, Pandas zu importieren~

Das obige ist der detaillierte Inhalt vonPandas implementiert die Deduplizierung doppelter Tabellen und konvertiert sie erneut in Tabellen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn