Maison >développement back-end >Tutoriel Python >pandas implémente la déduplication des tables en double et les reconvertit en tables
Ce qui suit est une méthode pandas pour dédupliquer les tables en double et les reconvertir en tables. Elle a une bonne valeur de référence et j'espère qu'elle sera utile à tout le monde. Venez jeter un œil ensemble
Lorsque python traite des données, DataFrame et set sont souvent utilisés.
train=pd.read_csv('XXX.csv')#读取文件 train=train['item_id']#选择要去重的列 train=set(train)#去重 data=pd.DataFrame(list(train),columns=['item_id'])#因为set是无序的,必须要经过list处理后才能成为DataFrame data.to_csv('xxx.csv',index=False)#保存表格
N'oubliez pas d'importer des pandas~
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!