찾다
백엔드 개발파이썬 튜토리얼Python&#s CSV 모듈 가이드

Guide to Python

データの操作はプログラミングでは避けられない部分であり、さまざまなファイル形式に深く関わることが多い私は、Python がどのようにプロセス全体を簡素化するかを常に高く評価してきました。

特にデータ分析において定期的に登場するファイル形式の 1 つが CSV ファイルです。

CSV (カンマ区切り値) は、そのシンプルさから一般的なデータ交換形式です。

幸いなことに、Python には csv と呼ばれる組み込みモジュールが付属しており、これらのファイルの操作が非常に効率的になります。

この記事では、基本的な使用方法から、データ処理の時間を大幅に節約できるより高度なテクニックまで、Python での csv モジュールの仕組みを詳しく説明します。


CSVファイルとは何ですか?

csv モジュールに入る前に、CSV ファイルとは何かについての基本的な理解から始めましょう。

CSV ファイルは基本的にプレーン テキスト ファイルで、各行がデータの行を表し、各値がカンマ (場合によってはタブなどの他の区切り文字) で区切られています。

これがどのようなものになるかの簡単な例を次に示します。

Name,Age,Occupation
Alice,30,Engineer
Bob,25,Data Scientist
Charlie,35,Teacher

なぜ csv モジュールなのか?

CSV ファイルは理論的には Python の標準ファイル処理メソッドを使用して読み取れる単なるテキスト ファイルであるのに、なぜ csv モジュールが必要なのか疑問に思われるかもしれません。

これは事実ですが、CSV ファイルには、埋め込まれたカンマ、セル内の改行、さまざまな区切り文字など、手動で処理するのが難しい複雑な要素が含まれる場合があります。

csv モジュールはこれらすべてを抽象化し、データに集中できるようにします。


CSVファイルの読み込み

コードの説明に入りましょう。

CSV ファイルに対して実行する最も一般的な操作は、その内容を読み取ることです。

モジュール内の csv.reader() 関数は、そのための使いやすいツールです。

これを行う方法についてのステップバイステップのガイドを次に示します。

基本的な CSV の読み取り

import csv

# Open a CSV file
with open('example.csv', 'r') as file:
    reader = csv.reader(file)

    # Iterate over the rows
    for row in reader:
        print(row)

これは CSV ファイルを読み取る最も簡単な方法です。

csv.reader() は反復可能を返し、各反復でファイルの行を表すリストが得られます。

ヘッダーの処理
ほとんどの CSV ファイルには、最初の行に列名などのヘッダーが付いています。

これらのヘッダーが必要ない場合は、反復処理時に最初の行を単純にスキップできます。

import csv

with open('example.csv', 'r') as file:
    reader = csv.reader(file)

    # Skip header
    next(reader)

    for row in reader:
        print(row)

時々、有用なデータと無関係なデータが混在するファイルを操作していると、ヘッダー以外の部分に基づいて行をスキップしていることに気づきます。

これは for ループ内で簡単に実行できます。

DictReader: CSV ファイルを読み取るためのより直感的な方法
CSV ファイルにヘッダーがある場合、 csv.DictReader() は、列名をキーとして各行を辞書として読み取るもう 1 つの素晴らしいオプションです。

import csv

with open('example.csv', 'r') as file:
    reader = csv.DictReader(file)

    for row in reader:
        print(row)

このアプローチにより、特に大規模なデータセットを扱う場合に、コードがより読みやすく直感的になりやすくなります。

たとえば、row['Name'] へのアクセスは、row[0] のようなインデックスベースのアクセスを扱うよりもはるかに明確に感じられます。


CSVファイルへの書き込み

データを読み取って処理したら、おそらくそれを保存またはエクスポートしたくなるでしょう。

csv.writer() 関数は、CSV ファイルに書き込むための頼りになるツールです。

基本的な CSV の書き方

import csv

# Data to be written
data = [
    ['Name', 'Age', 'Occupation'],
    ['Alice', 30, 'Engineer'],
    ['Bob', 25, 'Data Scientist'],
    ['Charlie', 35, 'Teacher']
]

# Open a file in write mode
with open('output.csv', 'w', newline='') as file:
    writer = csv.writer(file)

    # Write data to the file
    writer.writerows(data)

writer.writerows() 関数は、リストのリストを取得して CSV ファイルに書き込みます。各内部リストはデータ行を表します。

DictWriter: CSV ファイルを作成するためのよりクリーンな方法
CSV ファイルを辞書に読み取るための DictReader があるのと同じように、CSV に辞書を書き込むための DictWriter があります。

このメソッドは、列名を明示的に指定する場合に特に便利です。

import csv

# Data as list of dictionaries
data = [
    {'Name': 'Alice', 'Age': 30, 'Occupation': 'Engineer'},
    {'Name': 'Bob', 'Age': 25, 'Occupation': 'Data Scientist'},
    {'Name': 'Charlie', 'Age': 35, 'Occupation': 'Teacher'}
]

# Open file for writing
with open('output.csv', 'w', newline='') as file:
    fieldnames = ['Name', 'Age', 'Occupation']
    writer = csv.DictWriter(file, fieldnames=fieldnames)

    # Write the header
    writer.writeheader()

    # Write the data
    writer.writerows(data)

DictWriter を使用すると、コードを読みやすく簡潔に保ちながら、CSV に辞書を書き込むための美しくクリーンなインターフェイスが得られます。


区切り文字のカスタマイズ

デフォルトでは、CSV モジュールはカンマを使用して値を区切りますが、タブやセミコロンなどの他の区切り文字を使用するファイルを操作している場合もあります。

csv モジュールは、区切り文字引数を指定することで、これらのケースを簡単に処理する方法を提供します。

import csv

with open('example_tab.csv', 'r') as file:
    reader = csv.reader(file, delimiter='\t')

    for row in reader:
        print(row)

カンマの代わりにセミコロンを使用する CSV ファイル (通常はヨーロッパのソースからのもの) を見つけましたが、Python の csv モジュールがこれを簡単に処理できることを知って安心しました。

カンマ、タブ、その他の区切り文字であっても、csv モジュールが対応します。


複雑なデータの処理

データのフィールド内にカンマ、引用符、さらには改行が含まれている場合はどうなりますか?

CSV モジュールは、引用メカニズムを使用してこのようなケースを自動的に処理します。

引用パラメーターを使用して、引用の動作を制御することもできます。

import csv

data = [
    ['Name', 'Occupation', 'Description'],
    ['Alice', 'Engineer', 'Works on, "cutting-edge" technology'],
    ['Bob', 'Data Scientist', 'Loves analyzing data.']
]

with open('complex.csv', 'w', newline='') as file:
    writer = csv.writer(file, quoting=csv.QUOTE_ALL)
    writer.writerows(data)

In this example, QUOTE_ALL ensures that every field is wrapped in quotes.

Other quoting options include csv.QUOTE_MINIMAL, csv.QUOTE_NONNUMERIC, and csv.QUOTE_NONE, giving you full control over how your CSV data is formatted.


Conclusion

Over the years, I’ve come to rely on the CSV format as a lightweight, efficient way to move data around, and Python’s csv module has been a trusty companion in that journey.

Whether you’re dealing with simple spreadsheets or complex, multi-line data fields, this module makes the process feel intuitive and effortless.

While working with CSVs may seem like a mundane task at first, it’s a gateway to mastering data manipulation.

In my experience, once you’ve conquered CSVs, you'll find yourself confidently tackling larger, more complex formats like JSON or SQL databases. After all, everything starts with the basics.

위 내용은 Python&#s CSV 모듈 가이드의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
파이썬 : 컴파일러 또는 통역사?파이썬 : 컴파일러 또는 통역사?May 13, 2025 am 12:10 AM

Python은 해석 된 언어이지만 편집 프로세스도 포함됩니다. 1) 파이썬 코드는 먼저 바이트 코드로 컴파일됩니다. 2) 바이트 코드는 Python Virtual Machine에 의해 해석되고 실행됩니다. 3)이 하이브리드 메커니즘은 파이썬이 유연하고 효율적이지만 완전히 편집 된 언어만큼 빠르지는 않습니다.

루프 대 루프를위한 파이썬 : 루프시기는 언제 사용해야합니까?루프 대 루프를위한 파이썬 : 루프시기는 언제 사용해야합니까?May 13, 2025 am 12:07 AM

USEAFORLOOPHENTERATINGOVERASERASERASPECIFICNUMBEROFTIMES; USEAWHILLOOPWHENTINUTIMONDITINISMET.FORLOOPSAREIDEALFORKNOWNSEDINGENCENCENS, WHILEWHILELOOPSSUITSITUATIONS WITHERMINGEDERITERATIONS.

파이썬 루프 : 가장 일반적인 오류파이썬 루프 : 가장 일반적인 오류May 13, 2025 am 12:07 AM

Pythonloopscanleadtoerrors likeinfiniteloops, modifyinglistsdizeration, off-by-by-byerrors, zero-indexingissues, andnestedloopineficiencies.toavoidthese : 1) aing'i

파이썬의 루프 및 루프의 경우 : 각각의 장점은 무엇입니까?파이썬의 루프 및 루프의 경우 : 각각의 장점은 무엇입니까?May 13, 2025 am 12:01 AM

ForloopSareadvantageForkNowniTerations 및 Sequence, OffingSimplicityAndInamicConditionSandunkNowniTitionS 및 ControlOver Terminations를 제공합니다

파이썬 : 편집과 해석에 대한 깊은 다이빙파이썬 : 편집과 해석에 대한 깊은 다이빙May 12, 2025 am 12:14 AM

Pythonusesahybridmodelofilationandlostretation : 1) ThePyThoninterPretreCeterCompileSsourcodeIntOplatform-IndependentBecode.

Python은 해석 된 또는 편집 된 언어입니까? 왜 중요한가?Python은 해석 된 또는 편집 된 언어입니까? 왜 중요한가?May 12, 2025 am 12:09 AM

Pythonisbothingretedandcompiled.1) 1) it 'scompiledtobytecodeforportabilityacrossplatforms.2) thebytecodeisthentenningreted, withfordiNamictyTeNgreted, WhithItmayBowerShiledlanguges.

루프 대 파이썬의 루프 : 주요 차이점 설명루프 대 파이썬의 루프 : 주요 차이점 설명May 12, 2025 am 12:08 AM

forloopsareideal when

루프를위한 것 및 기간 : 실용 가이드루프를위한 것 및 기간 : 실용 가이드May 12, 2025 am 12:07 AM

forloopsareusedwhendumberofitessiskNowninadvance, whilewhiloopsareusedwhentheationsdepernationsorarrays.2) whiloopsureatableforscenarioScontiLaspecOndCond

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

에디트플러스 중국어 크랙 버전

에디트플러스 중국어 크랙 버전

작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

Atom Editor Mac 버전 다운로드

Atom Editor Mac 버전 다운로드

가장 인기 있는 오픈 소스 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.