ホームページ >バックエンド開発 >Python チュートリアル >Python で CSV ファイルを読み取る方法とテクニック

Python で CSV ファイルを読み取る方法とテクニック

WBOY
WBOYオリジナル
2024-04-03 18:36:021144ブラウズ

CSV モジュールまたは Pandas を使用して CSV ファイルからデータを読み取る CSV モジュールは基本的なインターフェイスを提供し、Pandas はより高度な機能を提供します。ヒントには、スニッファーを使用した区切り文字の決定、区切り文字の指定、欠損値の処理、チャンクでの読み取りなどがあります。実際のケース: 温度データを読み取り、グラフを描画し、CSV ファイルの処理における Python の能力を実証します。

Python で CSV ファイルを読み取る方法とテクニック

Python で CSV ファイルを読み取る方法とテクニック

概要

CSV (カンマ区切り値) ファイルは、データが行に編成され、各行がカンマ区切りのフィールドで構成される構造化テキスト ファイルです。 Python では、CSV ファイルを読み取る方法がいくつかあります。

CSV モジュールの使用

CSV モジュールは、CSV ファイルの読み取りと書き込みに便利なインターフェイスを提供します。 csv モジュールを使用して CSV ファイルからデータを読み取る簡単な例を次に示します。

import csv

with open('data.csv', 'r') as f:
    reader = csv.reader(f)
    for row in reader:
        print(row)

Pandas の使用

Pandas はデータ用のライブラリです。操作と分析のための強力なライブラリ。次のような、より高度な CSV ファイル処理機能を提供します。

import pandas as pd

df = pd.read_csv('data.csv')
print(df.head())  # 显示数据的前五行

実践例: 温度データの読み取り

次は、Python を使用して CSV ファイルを読み取り、分析する方法です。温度データの実際のケース:

import csv

# 从CSV文件读取气温数据
with open('temp_data.csv', 'r') as f:
    reader = csv.reader(f)
    data = list(reader)

# 创建日期和气温列表
dates = [row[0] for row in data[1:]]
temps = [float(row[1]) for row in data[1:]]

# 绘制气温随时间的变化图
import matplotlib.pyplot as plt

plt.plot(dates, temps)
plt.xlabel('日期')
plt.ylabel('气温')
plt.title('气温变化图')
plt.show()

Tips

  • Sniffer を使用して区切り記号を決定する: CSV 内の #Sniffer# module ## クラスはファイル内の区切り文字を検出できます。
  • 区切り文字を指定します: delimiter パラメータを使用して CSV ファイルの区切り文字を指定し、エラーを回避できます。
  • 欠損値の処理: CSV ファイルに欠損値が含まれている場合は、na_values パラメーターを使用して、欠損値の処理方法を指定できます。
  • チャンクで読み取る: chunksize パラメーターを使用して、大きな CSV ファイルをチャンクで読み取り、メモリを節約します。

以上がPython で CSV ファイルを読み取る方法とテクニックの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。