首頁  >  文章  >  後端開發  >  深入了解python檔案讀寫操作的方法

深入了解python檔案讀寫操作的方法

高洛峰
高洛峰原創
2017-03-17 17:14:481451瀏覽

1.open

使用open開啟檔案後一定要記得呼叫檔案物件的close()方法。例如可以用try/finally語句來確保最後能關閉檔案。

file_object = open('thefile.txt')

try:

     all_the_text = file_object.read( )

finally:

     file_object.close( )

#註:不能把open語句放在try區塊裡,因為當開啟檔案出現異常時,檔案物件file_object無法執行close()方法。

2.讀取檔案

讀取文字檔案

input = open('data', 'r')

#第二個參數預設為r

input = open('data')

 

讀二進位檔案

input = open('data', 'rb')

 

讀取所有內容

file_object = open('thefile.txt')

try:

     all_the_text = file_object.read( )

finally:

     file_object.close( )

 

讀取固定位元組

#file_object = open('abinfile', 'rb')

try:

    while 真:

         chunk = file_object.read(100)

        ## if not chunk:

           

break

         do_something_with(chunk)

finally:## #.

## 

讀每行

list

_of_all_the_lines = file_object.

readline

s( )如果檔案是文字文件,也可以直接遍歷文件物件取得每行:##for

line in file_object:

     process line

 

3.寫檔案

寫文字檔

output = open('data', 'w')

 

寫二進位檔案

#output = open('data', 'wb')

 

追加寫入檔案

output = open('data', 'w+')

 

寫入資料

file_object = open('thefile.txt', 'w')

file_object.write(all_the_text)

file_object .close( )

 

寫入多行

file_object.writelines(list_of_text_strings)

注意,呼叫writelines寫入多行在效能上會比使用write一次性寫入要高。

在處理日誌檔案的時候,常常會遇到這樣的情況:日誌檔案巨大,不可能一次把整個檔案讀入到記憶體中進行處理,例如需要在一台物理記憶體為2GB 的機器上處理一個2GB 的日誌文件,我們可能希望每次只處理其中200MB 的內容。

Python

中,內建的 File 物件直接提供了一個 readlines(sizehint)

函數

來完成這樣的事情。以下面的程式碼為例:

file = open('test.log', 'r')sizehint = 209715200   # 200Mposition = 0lines = file.readlines(sizehint)while#position = 0lines = file.readlines(sizehint)while not file.tell() - position < 0:       position = file.tell()       lines = file.readlines(sizehint)

每次呼叫readlines(sizehint) 函數,會傳回約200MB 的資料,且所傳傳回的必然都是完整的行數據,大多數情況下,傳回的資料的位元組數會稍微比sizehint 指定的值大一點(除最後一次呼叫readlines(sizehint) 函數的時候)。通常情況下,Python 會自動將使用者指定的 sizehint 的值調整成內部快取大小的整數倍。 file在python是一個特殊的類型,它用於在python程式中對外部的檔案進行操作。在python中一切都是對象,file也不例外,file有file的方法和屬性。以下先來看看如何建立一個file物件:

file(name[, mode[, buffering]]) 

file()函數用來建立一個file對象,它有一個名叫open(),可能更形像一些,它們是

內建函數

。來看看它的參數。它參數都是以

字串

的形式傳遞的。 name是檔案的名字。

mode是開啟的模式,可選的值為r w a U,分別代表讀取(預設) 寫入 新增支援各種換行符號的模式。用w或a模式開啟檔案的話,如果檔案不存在,那就自動建立。此外,用w模式開啟一個已經存在的檔案時,原有文件的內容會被清空,因為一開始文件的操作的標記是在文件的開頭的,這時候進行寫操作,無疑會把原有的內容給抹掉。由於歷史的原因,換行符在不同的系統中有不同模式,例如在unix中是一個\n,而在windows中是'\r\n',用U模式開啟文件,就是支援所有的換行模式,也就說'\r' '\n' '\r\n'都可表示換行,會有一個tuple用來存貯這個檔案中用到過的換行符。不過,雖說換行有多種模式,讀到python中統一用\n代替。在模式字元的後面,還可以加上+ b t這兩種標識,分別表示可以對檔案同時進行讀寫操作和用二進位模式、文字模式(預設)開啟檔案。

buffering如果為0表示不進行緩衝;如果為1表示進行「行緩衝「;如果是一個大於1的數表示緩衝區的大小,應該是以位元組為單位的。

file物件有自己的屬性和方法。先來看看file的屬性。

closed #標記檔案是否已關閉,由close()改寫 

encoding #檔案編碼 

mode #開啟模式 

#name #檔案名稱 

newlines #檔案中使用的換行模式,是一個tuple 

softspace #boolean型,一般為0,據說用於print

#file的讀寫方法:

F.read([size]) #size為讀取的長度,以byte為單位 

F.readline([size ]) 

#讀一行,如果定義了size,有可能回傳的只是一行的一部分 

F.readlines([size]) 

把檔案每一行作為一個list的一個成員,並回傳這個list。其實它的內部是透過循環呼叫readline()來實現的。如果提供size參數,size是表示讀取內容的總長,也就是說可能只讀到文件的一部分。

F.write(str) 

#把str寫到檔案中,write()不會在str後面加上一個換行符號 

F.writelines( seq) 

#把seq的內容全部寫到檔案中。這個函數也只是忠實地寫入,不會在每行後面加上任何東西。 

file的其他方法:

F.close() 

#關閉檔案。 python會在一個文件不用後自動關閉文件,不過這項功能沒有保證,最好還是養成自己關閉的習慣。如果一個檔案關閉後也操作會產生ValueError 

F.flush() 

#將緩衝區的內容寫入硬碟 

F.fileno() 

#回傳一個長整數的」檔案標籤「 

F.isatty() 

#檔案是否是終端裝置檔案( unix系統中的) 

F.tell() 

#傳回檔案作業標記的目前位置,以檔案的開頭為原點 

F.next() 

#傳回下一行,並將檔案作業標記移轉到下一行。把一個file用於for ... in file這樣的語句時,就是呼叫next()函數來實現遍歷的。 

F.seek(offset[,whence]) 

##將檔案打作業標記移到offset的位置。這個offset一般是相對於文件的開頭來計算的,一般為正數。但如果提供了whence參數就不一定了,whence可以為0表示從頭開始計算,1表示以目前位置為原點計算。 2表示以文件末端為原點進行計算。需要注意,如果文件以a或a+的模式打開,每次進行寫入操作時,文件操作標記會自動返回文件末尾。 

F.truncate([size]) 

#把檔案裁成規定的大小,預設的是裁切到目前檔案作業標記的位置。如果size比文件的大小還要大,依據系統的不同可能是不改變文件,也可能是用0把文件補到對應的大小,也可能是以一些隨機的內容加上去。


以上是深入了解python檔案讀寫操作的方法的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn