ホームページ >バックエンド開発 >Python チュートリアル >CSV モジュールと Pandas を使用して CSV ファイルから特定の列を読み取る方法
CSV モジュールを使用して CSV ファイルから特定の列を読み取る: 総合ガイド
CSV ファイルを解析し、特定の列からデータを抽出したい列はデータ分析における一般的なタスクです。このトピックをさらに詳しく説明するために、CSV ファイルの例を考えてみましょう。
ID | Name | Address | City | State | Zip | Phone | OPEID | IPEDS | 10 | C... | 130 W.. | Mo.. | AL... | 3.. | 334.. | 01023 | 10063 |
ID、Name、Zip、Phone を含む列のみをキャプチャする必要があるとします。
Using CSV モジュール
当初、このアプローチは row[column_number] を使用して各行を反復処理することでした。しかし、この方法は効果がないことが判明しました。代わりに、CSV モジュールのリーダー メソッドを使用して、必要な列を指定できます。
import csv included_cols = [1, 2, 6, 7] with open(csv_file, 'rb') as csvfile: reader = csv.reader(csvfile, delimiter=' ') for row in reader: content = list(row[i] for i in included_cols) # Print the specific columns for each row print(content)
このコードは、各行に必要な列を出力します。
Pandas の紹介
上記のメソッドは機能しますが、Pandas ライブラリは CSV ファイルを操作するためのより洗練されたソリューションを提供します。 Pandas を使用すると、CSV ファイルを読み取り、特定の列を変数に保存するのは簡単です。
import pandas as pd # Read the CSV file into a DataFrame df = pd.read_csv(csv_file) # Save a specific column into a variable names = df['Name']
結論
CSV モジュールでは、行を反復処理し、リスト内包表記を使用して目的の列を抽出します。より包括的なソリューションについては、CSV ファイル操作用の使いやすい API を提供する Pandas ライブラリの使用を検討してください。
以上がCSV モジュールと Pandas を使用して CSV ファイルから特定の列を読み取る方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。