ホームページ >バックエンド開発 >Python チュートリアル >pandas は重複テーブルの重複排除を実装し、それらをテーブルに再変換します

pandas は重複テーブルの重複排除を実装し、それらをテーブルに再変換します

不言
不言オリジナル
2018-04-18 15:47:283012ブラウズ

次の記事では、重複したテーブルを削除して再度テーブルに変換するパンダのメソッドを紹介します。これは非常に参考になるので、皆さんのお役に立てれば幸いです。一緒に見に来てください

Pythonがデータを処理する際には、DataFrameとsetがよく使われます。

train=pd.read_csv('XXX.csv')#读取文件 
train=train['item_id']#选择要去重的列 
train=set(train)#去重 
data=pd.DataFrame(list(train),columns=['item_id'])#因为set是无序的,必须要经过list处理后才能成为DataFrame 
data.to_csv('xxx.csv',index=False)#保存表格

パンダをインポートするのを忘れないでください~

以上がpandas は重複テーブルの重複排除を実装し、それらをテーブルに再変換しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。