ホームページ  >  記事  >  バックエンド開発  >  CSV モジュールと Pandas を使用して CSV ファイルから特定の列を読み取る方法

CSV モジュールと Pandas を使用して CSV ファイルから特定の列を読み取る方法

Patricia Arquette
Patricia Arquetteオリジナル
2024-11-15 13:52:02212ブラウズ

How to Read Specific Columns from a CSV File Using the CSV Module and Pandas?

CSV モジュールを使用して CSV ファイルから特定の列を読み取る: 総合ガイド

CSV ファイルを解析し、特定の列からデータを抽出したい列はデータ分析における一般的なタスクです。このトピックをさらに詳しく説明するために、CSV ファイルの例を考えてみましょう。

ID | Name | Address | City | State | Zip | Phone | OPEID | IPEDS |
10 | C... | 130 W.. | Mo.. | AL... | 3.. | 334.. | 01023 | 10063 |

ID、Name、Zip、Phone を含む列のみをキャプチャする必要があるとします。

Using CSV モジュール

当初、アプローチは次を使用して各行を反復処理することでした。行[列番号]。しかし、この方法は効果がないことが判明しました。代わりに、CSV モジュールのリーダー メソッドを使用して、必要な列を指定できます。

import csv

included_cols = [1, 2, 6, 7]
with open(csv_file, 'rb') as csvfile:
    reader = csv.reader(csvfile, delimiter=' ')
    for row in reader:
        content = list(row[i] for i in included_cols)
        # Print the specific columns for each row
        print(content)

このコードは、各行に必要な列を出力します。

Pandas の紹介

上記のメソッドは機能しますが、Pandas ライブラリは CSV ファイルを操作するためのより洗練されたソリューションを提供します。 Pandas を使用すると、CSV ファイルを読み取り、特定の列を変数に保存するのは簡単です。

import pandas as pd

# Read the CSV file into a DataFrame
df = pd.read_csv(csv_file)

# Save a specific column into a variable
names = df['Name']

結論

CSV モジュールでは、行を反復処理し、リスト内包表記を使用して目的の列を抽出します。より包括的なソリューションについては、CSV ファイル操作用の使いやすい API を提供する Pandas ライブラリの使用を検討してください。

以上がCSV モジュールと Pandas を使用して CSV ファイルから特定の列を読み取る方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。