Rumah > Artikel > pembangunan bahagian belakang > Dapatkan semua pengetahuan tentang membaca fail dalam Python dalam satu artikel
Fail ada di mana-mana, tidak kira bahasa pengaturcaraan yang kita gunakan, memproses fail adalah penting untuk setiap pengaturcara
Pemprosesan fail ialah proses A untuk mencipta fail, menulis data, dan membaca data daripada mereka. Python mempunyai banyak pakej untuk memproses jenis fail yang berbeza, menjadikannya lebih mudah dan lebih mudah untuk kami menyelesaikan kerja pemprosesan fail
Ringkasan artikel ini:
Sebelum mengakses kandungan fail, kita perlu membuka fail tersebut. Python menyediakan fungsi terbina dalam yang membantu kami membuka fail dalam mod yang berbeza. Fungsi open() menerima dua parameter asas: nama fail dan mod
Mod lalai ialah "r", yang membuka fail dalam mod baca sahaja. Mod ini menentukan cara kami mengakses fail dan cara kami memanipulasi kandungannya. Fungsi open() menyediakan beberapa mod berbeza, yang akan kita bincangkan satu demi satu kemudian
Mari gunakan fail 'Zen of Python' untuk membincangkan dan belajar kemudian
f = open('zen_of_python.txt', 'r') print(f.read()) f.close()
Output:
The Zen of Python, by Tim Peters Beautiful is better than ugly. Explicit is better than implicit. Simple is better than complex. Complex is better than complicated. Flat is better than nested. Sparse is better than dense. Readability counts. ...
Dalam kod di atas, fungsi open() membuka fail teks dalam mod baca sahaja, yang membolehkan kami mendapatkan maklumat daripada fail tanpa mengubahnya. Dalam baris pertama, output fungsi open() diberikan kepada objek f yang mewakili fail teks Dalam baris kedua, kami menggunakan kaedah read() untuk membaca keseluruhan fail dan mencetak kandungannya. ) kaedah berada di baris terakhir Tutup fail. Adalah penting untuk ambil perhatian bahawa kami mesti sentiasa menutup fail terbuka selepas memprosesnya untuk mengosongkan sumber komputer kami dan mengelak daripada membuang pengecualian
Dalam Python, kami boleh menggunakan pengurus konteks dengan untuk memastikan program dikeluarkan selepas fail ditutup Sumber digunakan, walaupun pengecualian berlaku
with open('zen_of_python.txt') as f: print(f.read())
Output:
The Zen of Python, by Tim Peters Beautiful is better than ugly. Explicit is better than implicit. Simple is better than complex. Complex is better than complicated. Flat is better than nested. Sparse is better than dense. Readability counts. ...
Kod di atas mencipta konteks menggunakan pernyataan with dan mengikat pembolehubah f, semua fail objects Kaedah boleh mengakses objek fail melalui pembolehubah ini. Kaedah read() membaca keseluruhan fail pada baris kedua dan kemudian menggunakan fungsi print() untuk mengeluarkan kandungan fail
Apabila atur cara mencapai penghujung konteks blok pernyataan with, ia menutup fail ke melepaskan sumber dan memastikan bahawa program lain Mereka boleh dipanggil seperti biasa. Biasanya apabila kita berurusan dengan objek yang tidak lagi perlu digunakan dan perlu ditutup dengan segera (seperti fail, pangkalan data dan sambungan rangkaian), sangat disyorkan untuk menggunakan pernyataan dengan
Perlu diingatkan di sini bahawa walaupun selepas keluar dari pengurus konteks Selepas blok, kita juga boleh mengakses pembolehubah f, tetapi fail ditutup. Mari cuba beberapa sifat objek fail dan lihat sama ada pembolehubah masih ada dan boleh diakses:
print("Filename is '{}'.".format(f.name)) if f.closed: print("File is closed.") else: print("File isn't closed.")
Output:
Filename is 'zen_of_python.txt'. File is closed.
Tetapi pada ketika ini tidak mungkin untuk membaca kandungan dari fail atau menulis pada fail, apabila fail ditutup, sebarang percubaan untuk mengakses kandungannya akan mengakibatkan ralat berikut:
f.read()
Output:
--------------------------------------------------------------------------- ValueErrorTraceback (most recent call last) ~AppDataLocalTemp/ipykernel_9828/3059900045.py in <module> ----> 1 f.read() ValueError: I/O operation on closed file.
Seperti yang kami nyatakan sebelum ini, kami perlu menentukan mod semasa membuka fail. Jadual berikut menunjukkan mod fail yang berbeza dalam Python:
Penerangan Mod
Kami juga boleh menentukan untuk membuka fail dalam mod teks 't', mod lalai atau mod binari 'b' . Mari lihat cara menyalin fail imej dataquest_logo.png menggunakan pernyataan mudah:
with open('dataquest_logo.png', 'rb') as rf: with open('data_quest_logo_copy.png', 'wb') as wf: for b in rf: wf.write(b)
Kod di atas menyalin imej logo Dataquest dan menyimpannya dalam laluan yang sama. Mod 'rb' membuka fail dalam mod binari untuk membaca, manakala mod 'wb' membuka fail dalam mod teks untuk penulisan selari
Terdapat banyak dalam Kaedah Python untuk membaca fail teks, di bawah kami memperkenalkan beberapa kaedah berguna untuk membaca kandungan fail teks
Setakat ini, kami telah mengetahui bahawa anda boleh menggunakan kaedah read() untuk membaca keseluruhan kandungan fail. Bagaimana jika kita hanya mahu membaca beberapa bait daripada fail teks, kita boleh menentukan bilangan bait dalam kaedah read(). Mari cuba:
with open('zen_of_python.txt') as f: print(f.read(17))
Output:
The Zen of Python
Kod mudah di atas membaca 17 bait pertama fail zen_of_python.txt dan mencetaknya
Kadangkala lebih masuk akal untuk membaca kandungan fail teks satu baris pada satu masa, dalam hal ini kita boleh menggunakan kaedah readline()
with open('zen_of_python.txt') as f: print(f.readline())
Output:
The Zen of Python, by Tim Peters
di atas Kod mengembalikan baris pertama fail dan jika kita memanggil kaedah itu sekali lagi ia akan mengembalikan baris kedua dalam fail dan lain-lain seperti ini:
with open('zen_of_python.txt') as f: print(f.readline()) print(f.readline()) print(f.readline()) print(f.readline())
Output:
The Zen of Python, by Tim Peters Beautiful is better than ugly. Explicit is better than implicit.
Kaedah Berguna ini membantu kami membaca keseluruhan fail secara berperingkat.
以下代码通过逐行迭代来输出整个文件,直到跟踪我们正在读取或写入文件的位置的文件指针到达文件末尾。当 readline() 方法到达文件末尾时,它返回一个空字符串
with open('zen_of_python.txt') as f: line = f.readline() while line: print(line, end='') line = f.readline()
Output:
The Zen of Python, by Tim Peters Beautiful is better than ugly. Explicit is better than implicit. Simple is better than complex. Complex is better than complicated. Flat is better than nested. Sparse is better than dense. Readability counts. Special cases aren't special enough to break the rules. Although practicality beats purity. Errors should never pass silently. Unless explicitly silenced. In the face of ambiguity, refuse the temptation to guess. There should be one-- and preferably only one --obvious way to do it. Although that way may not be obvious at first unless you're Dutch. Now is better than never. Although never is often better than *right* now. If the implementation is hard to explain, it's a bad idea. If the implementation is easy to explain, it may be a good idea. Namespaces are one honking great idea -- let's do more of those!
上面的代码在 while 循环之外读取文件的第一行并将其分配给 line 变量。在 while 循环中,它打印存储在 line 变量中的字符串,然后读取文件的下一行。while 循环迭代该过程,直到 readline() 方法返回一个空字符串。空字符串在 while 循环中的计算结果为 False,因此迭代过程终止
读取文本文件的另一个有用方法是 readlines() 方法,将此方法应用于文件对象会返回包含文件每一行的字符串列表
with open('zen_of_python.txt') as f: lines = f.readlines()
让我们检查 lines 变量的数据类型,然后打印它:
print(type(lines)) print(lines)
Output:
<class 'list'> ['The Zen of Python, by Tim Petersn', 'n', 'Beaut...]
它是一个字符串列表,其中列表中的每个项目都是文本文件的一行,``n` 转义字符表示文件中的新行。此外,我们可以通过索引或切片操作访问列表中的每个项目:
print(lines) print(lines[3:5]) print(lines[-1])
Output:
['The Zen of Python, by Tim Petersn', 'n', 'Beautiful is better than ugly.n', ... -- let's do more of those!"] ['Explicit is better than implicit.n', 'Simple is better than complex.n'] Namespaces are one honking great idea -- let's do more of those!
到目前为止,我们已经学会了如何使用常规文本文件。但是有时数据采用 CSV 格式,数据专业人员通常会检索所需信息并操作 CSV 文件的内容
接下来我们将使用 CSV 模块,CSV 模块提供了有用的方法来读取存储在 CSV 文件中的逗号分隔值。我们现在就尝试一下
import csv with open('chocolate.csv') as f: reader = csv.reader(f, delimiter=',') for row in reader: print(row)
Output:
['Company', 'Bean Origin or Bar Name', 'REF', 'Review Date', 'Cocoa Percent', 'Company Location', 'Rating', 'Bean Type', 'Country of Origin'] ['A. Morin', 'Agua Grande', '1876', '2016', '63%', 'France', '3.75', 'Âxa0', 'Sao Tome'] ['A. Morin', 'Kpime', '1676', '2015', '70%', 'France', '2.75', 'Âxa0', 'Togo'] ['A. Morin', 'Atsane', '1676', '2015', '70%', 'France', '3', 'Âxa0', 'Togo'] ['A. Morin', 'Akata', '1680', '2015', '70%', 'France', '3.5', 'Âxa0', 'Togo'] ...
CSV 文件的每一行形成一个列表,其中每个项目都可以轻松的被访问,如下所示:
import csv with open('chocolate.csv') as f: reader = csv.reader(f, delimiter=',') for row in reader: print("The {} company is located in {}.".format(row[0], row[5]))
Output:
The Company company is located in Company Location. The A. Morin company is located in France. The A. Morin company is located in France. The A. Morin company is located in France. The A. Morin company is located in France. The Acalli company is located in U.S.A.. The Acalli company is located in U.S.A.. The Adi company is located in Fiji. ...
很多时候,使用列的名称而不是使用它们的索引,这通常对专业人员来说更方便。在这种情况下,我们不使用 reader() 方法,而是使用返回字典对象集合的 DictReader() 方法
import csv with open('chocolate.csv') as f: dict_reader = csv.DictReader(f, delimiter=',') for row in dict_reader: print("The {} company is located in {}.".format(row['Company'], row['Company Location']))
Output:
The A. Morin company is located in France. The A. Morin company is located in France. The A. Morin company is located in France. The A. Morin company is located in France. The Acalli company is located in U.S.A.. The Acalli company is located in U.S.A.. The Adi company is located in Fiji. ...
我们主要用于存储和交换数据的另一种流行文件格式是 JSON,JSON 代表 JavaScript Object Notation,允许我们使用逗号分隔的键值对存储数据
接下来我们将加载一个 JSON 文件并将其作为 JSON 对象使用,而不是作为文本文件,为此我们需要导入 JSON 模块。然后在 with 上下文管理器中,我们使用了属于 json 对象的 load() 方法,它加载文件的内容并将其作为字典存储在上下文变量中。
import json with open('movie.json') as f: content = json.load(f) print(content)
Output:
{'Title': 'Bicentennial Man', 'Release Date': 'Dec 17 1999', 'MPAA Rating': 'PG', 'Running Time min': 132, 'Distributor': 'Walt Disney Pictures', 'Source': 'Based on Book/Short Story', 'Major Genre': 'Drama', 'Creative Type': 'Science Fiction', 'Director': 'Chris Columbus', 'Rotten Tomatoes Rating': 38, 'IMDB Rating': 6.4, 'IMDB Votes': 28827}
让我们检查内容变量的数据类型:
print(type(content))
Output:
<class 'dict'>
它的数据类型是字典,因此我们可以方便的从中提取数据
print('{} directed by {}'.format(content['Title'], content['Director']))
Output:
Bicentennial Man directed by Chris Columbus
今天我们讨论了 Python 中的文件处理,重点是读取文件的内容。我们了解了 open() 内置函数、with 上下文管理器,以及如何读取文本、CSV 和 JSON 等常见文件类型。
好了,这就是今天分享的全部内容,喜欢就点个赞吧~
Atas ialah kandungan terperinci Dapatkan semua pengetahuan tentang membaca fail dalam Python dalam satu artikel. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!