搜尋
首頁後端開發Python教學Python檔案處理方法、os模組和glob模組怎麼使用

    一、檔案基本的動作

    1、open() 開啟檔案

    open() 方法用於開啟一個文件,並返回File文件對象,在對文件進行處理過程都需要使用到這個函數,如果該文件無法被打開,會拋出OSError。

    注意:使用 open() 方法一定要保證關閉檔案對象,也就是呼叫 close() 方法。

    open() 函數常用形式是接收兩個參數:檔案名稱(file)和模式(mode)。

    open(file, mode='r')

    完整的語法格式為:

    open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

    2、read() 讀取檔案

    f = open(r'/Users/mac/desktop/jupyter/pythonCourseware/32.txt', mode='r')# read模式打开文件
    data = f.read() # 读取文件内容,向操作系统发起读请求,会被操作系统转成具体的硬盘操作,将内容由硬盘读入内存
    print(data)
    # 由于Python的垃圾回收机制只回收引用计数为0的变量,但是打开文件还占用操作系统的资源,所以我们需要回收操作系统的资源资源
    # del f 只是回收变量f
    f.close()

    3、write()寫檔案:

    # write模式打开文件
    f = open(r'/Users/mac/desktop/jupyter/pythonCourseware/32.txt', mode='w')
    f.write("""name = 'nick'
    pwd = '123'""")
    f.close()

    4 、with open()方法

    with open()方法不僅提供自動釋放作業系統佔用資源的方法,並且with open可以使用逗號分隔,一次開啟多個文件,實現文件的快速拷貝。

    with open('32.txt', 'rt', encoding='utf8') as f:
        print(f.read())
    
    with open('32.txt', 'rb') as fr, \
            open('35r.txt', 'wb') as fw:
        f.write(f.read())

    二、檔案的開啟模式

    檔案操作的基礎模式有四種

    • r模式:(預設)唯讀模式,只能讀不能寫,文件的指針將會放在文件的開頭,文件不存在時報錯。

    • w模式:覆蓋寫入模式,檔案不存在則創建, 並從開頭開始編輯,即原有內容會被刪除,即完全覆蓋。

    • a模式:追加寫入模式:檔案不存在則創建,存在則在檔案最後追加內容,就是說,新的內容將會被寫入到已有內容之後。

    檔案讀寫內容的格式有兩種

    • t模式為text (預設):文字模式

    • #b模式為bytes:位元組模式。

    要注意的是:t、b這兩種模式都不能單獨使用,都需要與r/w/a之一連用。

    1、檔案r開啟模式

    1、讀取文字
    # rt: read by text
    # windows的操作系统默认编码为gbk,因此需要使用utf8编码
    f = open('32.txt', mode='rt', encoding='utf8')
    data = f.read()
    print(data) # nick最帅吗
    print(type(data)} # <class &#39;str&#39;>
    f.close()
    2、讀取位元組
    # rb: read by bytes
    f = open(&#39;32.txt&#39;, mode=&#39;rb&#39;)
    data = f.read()
    print(data) # b&#39;aaa\nbbb\nccc\nnick\xe6\x9c\x80\xe5\xb8\x85\xe5\x90\x97&#39;
    print(type(data)) # <class &#39;bytes&#39;>
    f.close()
    3、for逐行讀取,相當於readline。
    fname = input("请输入要打开的文件名称:")
    fo = open(fname, "r")
    print(type(fo))  # <class &#39;_io.TextIOWrapper&#39;>
    for line in fo:
        print(line)
    fo.close()
    4、讀取方法:
    • read(size):一次讀取檔案的所有內容,如果給出參數,讀入前size長度。

    • readline(size):讀入一行內容,包括換行符號為 '\n'。如果給定參數,讀入該行前size長度。下次可以接著上次讀完的地方繼續讀。 f.readline() 如果回傳一個空字串, 說明已經已經讀取到最後一行。

    • readlines([sizeint]):讀取所有行並返回列表,若給定sizeint>0,傳回總和大約為sizeint位元組的行, 實際讀取值可能比sizeint 較大, 因為需要填滿緩衝區。

    f = open(&#39;32.txt&#39;, mode=&#39;rt&#39;, encoding=&#39;utf8&#39;)
    print(f.readable())  #True 判断文件是否可读
    data1 = f.readline()
    data2 = f.readlines()
    print(data1) # aaa
    print(data2) # [&#39;bbb\n&#39;, &#39;ccc\n&#39;, &#39;nick最帅吗&#39;]
    f.close()

    2、檔案W開啟模式

    只能寫,不能讀,檔案存在的時候回清空檔案後再寫入內容;檔案不存在的時候會建立文件後寫入內容。

    1、文字模式
    f = open(&#39;34w.txt&#39;, mode=&#39;wt&#39;, encoding=&#39;utf8&#39;)
    print(f"f.readable(): {f.readable()}") #False
    f.write(&#39;nick 真帅呀\n&#39;)  # &#39;\n&#39;是换行符
    f.write(&#39;nick,nick, you drop, I drop.&#39;)
    f.write(&#39;nick 帅的我五体投地&#39;)
    f.flush()  # 立刻将文件内容从内存刷到硬盘
    f.close()
    2、位元組模式
    f = open(&#39;34a.txt&#39;, mode=&#39;wb&#39;)
    f.write(&#39;nick 帅的我五体投地&#39;.encode(&#39;unicode_escape&#39;) )  # 编码成bytes类型再写入
    print(type(&#39;nick 帅的我五体投地&#39;.encode(&#39;unicode_escape&#39;))) #<class &#39;bytes&#39;>
    f.close()

    注意:b模式是通用的模式,因為所有的檔案在硬碟中都是以二進位的形式儲存的。

    要注意的是:b模式讀寫文件,一定不能加上encoding參數,因為二進位無法再編碼。

    try:
        import requests
    
        response = requests.get( &#39;https://cache.yisu.com/upload/information/20220528/112/3002.jpg&#39;)
        data = response.content
    
        f = open(&#39;mv.jpg&#39;, &#39;wb&#39;)
        f.write(data)
        print(&#39;done...&#39;)
        f.close()
    except Exception as e:
        print(e, &#39;报错了,那就算了吧,以后爬虫处会详细介绍&#39;)
    3、寫入方法:
    • write(s):將字串寫入文件,傳回的是寫入的字元長度。

    • writelines(lines):向檔案寫入一個多行字串列表,如果需要換行則要自行加入每行的換行符。

    • flush():刷新檔案內部緩衝,直接把內部緩衝區的資料立刻寫入檔案, 而不是被動的等待輸出緩衝區寫入。

    3、檔案a開啟模式

    a: 可以追加。文件存在,則在文件的末端寫入內容;文件不存在的時候會建立文件後寫入內容。

    # at
    f = open(&#39;34a.txt&#39;, mode=&#39;at&#39;, encoding=&#39;utf8&#39;)
    print(f.readable()) # False
    f.write(&#39;nick 真帅呀\n&#39;)  # &#39;\n&#39;是换行符
    f.write(&#39;nick,nick, you drop, I drop.&#39;)
    f.write(&#39;nick 帅的我五体投地&#39;)
    f.close()

    4、 可讀、可寫入

    • r  :可讀、可寫入。文件指針將會放在文件的開頭。

    • rb : 可讀、可寫入二進位格式

    • #w : 可寫、可讀。如果該文件已存在則開啟文件,並從開頭開始編輯,即原有內容會被刪除。如果該文件不存在,請建立新文件。

    • wb : 可寫、可讀 二進位格式

    • a : 可追加、可讀。如果該檔案已存在,則檔案指標將會放在檔案的結尾。文件開啟時會是追加模式。如果該檔案不存在,建立新檔案用於讀寫。

    • ab : 可追加、可讀二進位格式

    # r+t
    with open(&#39;32.txt&#39;, &#39;r+&#39;, encoding=&#39;utf-8&#39;) as fr:
        print(fr.readable())  # True
        print(fr.writable())  # True

    三、檔案指標運算

    但凡涉及檔案指標的都是位元組個數。

    1、seek(offset, from_what) :改變目前檔案操作指標的位置

    from_what 的值, 如果是0 表示開頭, 如果是1 表示目前位置, 2 表示檔案的結尾,例如:

    • seek(x,0) : 從起始位置即檔案首行首字元開始移動x 個字元

    • ##seek (x,1) : 表示從目前位置往後移動x個字元

    • seek(-x,2):表示从文件的结尾往前移动x个字符

    from_what 值为默认为0,即文件开头。

    f.seek(0) # 回到文件开头

    下面给出一个完整的例子:

    f = open(&#39;32.txt&#39;, &#39;rb+&#39;)
    print(f.write(b&#39;0123456789abcdef&#39;)) # 16
    print(f.seek(5))  # 移动到文件的第六个字节 # 5
    print(f.read(1))  # b&#39;5&#39;
    print(f.seek(-3, 2))  # 移动到文件的倒数第三字节 # 13
    print(f.read(1)) # b&#39;d&#39;

    2、tell():告诉文件当前位置。

    每次统计都是从文件开头到当前指针所在位置

    with open(&#39;32.txt&#39;, &#39;rb&#39;) as fr:
        fr.seek(4, 0)
        print(fr.tell() )  # 4

    3、truncate([size]):截断

    从文件的首行首字符开始截断,截断文件为 size 个字符,无 size 表示从当前位置截断;

    截断之后后面的所有字符被删除,其中 Widnows 系统下的换行代表2个字符大小。

    文件的打开方式必须可写,但是不能用w或w+等方式打开,因为那样直接清空文件了,所以truncate()要在r+或a或a+等模式下测试效果。它的参照物永远是文件头。

    truncate()不加参数,相当于清空文件。

    with open(&#39;32.txt&#39;, &#39;ab&#39;) as fr:
        fr.truncate(2)  # 截断2个字节后的所有字符,如果3个字节一个字符,只能截断2/3个字符,还会遗留1/3个字符,会造成乱码

    四、文件修改的两种方式

    以读的方式打开原文件,以写的方式打开一个新的文件,把原文件的内容进行修改(一行一行的修改或者全部修改),然后写入新文件,之后利用os模块的方法,把原文件删除,重命名新文件为原文件名,达到以假乱真的目的。

    方式1、将硬盘存放的该文件的内容全部加载到内存,在内存中是可以修改的,修改完毕后,再由内存覆盖到硬盘(word,vim,nodpad++等编辑器)。

    import os
    
    with open(&#39;37r.txt&#39;) as fr, open(&#39;37r_swap.txt&#39;, &#39;w&#39;) as fw:
        data = fr.read()  # 全部读入内存,如果文件很大,会很卡
        data = data.replace(&#39;tank&#39;, &#39;tankSB&#39;)  # 在内存中完成修改
    
        fw.write(data)  # 新文件一次性写入原文件内容
    
    # 删除原文件
    os.remove(&#39;37r.txt&#39;)
    # 重命名新文件名为原文件名
    os.rename(&#39;37r_swap.txt&#39;, &#39;37r.txt&#39;)

    方式2、将硬盘存放的该文件的内容一行一行地读入内存,修改完毕就写入新文件,最后用新文件覆盖源文件。

    import os
    
    with open(&#39;37r.txt&#39;) as fr, open(&#39;37r_swap.txt&#39;, &#39;w&#39;) as fw:
         for line in fr: # 循环读取文件内容,逐行修改
            line = line.replace(&#39;jason&#39;, &#39;jasonSB&#39;)
            fw.write(line)  # 新文件写入原文件修改后内容
    
    os.remove(&#39;37r.txt&#39;)
    os.rename(&#39;37r_swap.txt&#39;, &#39;37r.txt&#39;)

    五、os文件处理模块

    os模块负责程序与操作系统的交互,提供了访问操作系统底层的接口,多用于文件处理。

    import os

    1、os模块

    • os.getcwd():获取当前工作目录,即当前python脚本工作的目录路径

    • os.chdir("dirname"):改变当前工作目录;相当于shell下cd

    • os.curdir:返回当前目录: ('.')

    • os.pardir:获取当前目录的父目录字符串名:('..')

    • os.listdir('dirname'):列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印

    • os.chmod(path, mode):更改权限

    • os.mkdir('dirname'):生成单级目录;相当于shell中mkdir dirname

    • os.makedirs('dirname1/dirname2'):可生成多层递归目录

    • os.remove(path):删除路径为path的文件。如果path 是一个文件夹,将抛出OSError; 查看下面的rmdir()删除一个 directory。

    • os.removedirs('dirname1'):若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推

    • os.rmdir('dirname'):删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname

    • os.rename("oldname","newname"):重命名文件/目录

    • os.renames(old, new):递归地对目录进行更名,也可以对文件进行更名。

    • os.stat('path/filename'):获取文件/目录信息

    • os.sep:输出操作系统特定的路径分隔符,win下为"\",Linux下为"/"

    • os.linesep:输出当前平台使用的行终止符,win下为"\t\n",Linux下为"\n"

    • os.pathsep:输出用于分割文件路径的字符串 win下为;,Linux下为:

    • os.name:输出字符串指示当前使用平台。win->'nt'; Linux->'posix'

    • os.system("bash command"):运行shell命令,直接显示

    • os.environ:获取系统环境变量

    2、os.path 模块

    主要用于获取文件的属性。

    以下是 os.path 模块的几种常用方法:

    • os.path.abspath(path):返回path规范化的绝对路径

    • os.path.split(path):将path分割成目录和文件名二元组返回

    • os.path.splitdrive(path):一般用在 windows 下,返回驱动器名和路径组成的

    • os.path.splitext(path):分割路径,返回路径名和文件扩展名的元组

    • os.path.dirname(path):返回path的目录名。其实就是os.path.split(path)的第一个元素

    • os.path.basename(path):返回path最后的文件名。如何path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素

    • os.path.exists(path):如果path存在,返回True;如果path不存在,返回False

    • os.path.isabs(path):如果path是绝对路径,返回True

    • os.path.isfile(path):如果path是一个存在的文件,返回True。否则返回False

    • os.path.isdir(path):如果path是一个存在的目录,则返回True。否则返回False

    • os.path.join(path2[, path3[, ...]]):将多个路径组合后返回,第一个绝对路径之前的参数将被忽略

    • os.path.getatime(path):返回path所指向的文件或者目录的最后存取时间

    • os.path.getmtime(path):返回path所指向的文件或者目录的最后修改时间

    • os.path.getsize(path): 返回文件大小,如果文件不存在就返回错误

    3、实例:

    1、获取指定目录及其子目录下的 py 文件

    import os
    import os.path
    
    """获取指定目录及其子目录下的 py 文件路径说明:l 用于存储找到的 py 文件路径 get_py 函数,递归查找并存储 py 文件路径于 l"""
    l = []
    
    
    def get_py(path, l):
        file_list = os.listdir(path)  # 获取path目录下所有文件
        for filename in file_list:
            path_tmp = os.path.join(path, filename)  # 获取path与filename组合后的路径
            if os.path.isdir(path_tmp):  # 如果是目录
                get_py(path_tmp, l)  # 则递归查找
            elif filename[-3:].upper() == &#39;.PY&#39;:  # 不是目录,则比较后缀名
                l.append(path_tmp)
    
    
    path = input(&#39;请输入路径:&#39;).strip()
    get_py(path, l)
    print(&#39;在%s目录及其子目录下找到%d个py文件\n分别为:\n&#39; % (path, len(l)))
    for filepath in l:
        print(filepath + &#39;\n&#39;)

    2、显示所有视频格式文件,mp4,avi,rmvb

    import os
    
    vedio_list = []
    
    def search_file(start_dir, target) :
        os.chdir(start_dir)
        
        for each_file in os.listdir(os.curdir) :
            ext = os.path.splitext(each_file)[1]
            if ext in target :
                vedio_list.append(os.getcwd() + os.sep + each_file + os.linesep) 
            if os.path.isdir(each_file) :
                search_file(each_file, target) # 递归调用
                os.chdir(os.pardir) # 递归调用后切记返回上一层目录
    
    start_dir = input(&#39;请输入待查找的初始目录:&#39;)
    program_dir = os.getcwd()
    
    target = [&#39;.mp4&#39;, &#39;.avi&#39;, &#39;.rmvb&#39;]
    
    search_file(start_dir, target)
    
    f = open(program_dir + os.sep + &#39;vedioList.txt&#39;, &#39;w&#39;)
    f.writelines(vedio_list)
    f.close()

    3、批量修改文件名

    import os
    
    path = input(&#39;请输入文件路径(结尾加上/):&#39;)
    
    # 获取该目录下所有文件,存入列表中
    fileList = os.listdir(path)
    
    n = 0
    for i in fileList:
        # 设置旧文件名(就是路径+文件名)
        oldname = path + os.sep + fileList[n]  # os.sep添加系统分隔符
    
        # 设置新文件名
        newname1 = path + os.sep + &#39;a&#39; + str(n + 1) + &#39;.JPG&#39;
    
        os.rename(oldname, newname1)  # 用os模块中的rename方法对文件改名c:\
        print(oldname, &#39;======>&#39;, newname1)
    
        n += 1

    七、glob模块:使用通配符查找文件

    用它可以查找符合特定规则的文件路径名。跟使用windows下的文件搜索差不多。

    查找文件只用到三个匹配符:“*”, “?”, “[]”。

    • “*”:匹配0个或多个字符;

    • “?”:匹配单个字符;

    • “[]”:匹配指定范围内的字符,如:[0-9]匹配数字。

    1、glob.glob:返回所有匹配的文件路径列表。

    它只有一个参数pathname,定义了文件路径匹配规则,这里可以是绝对路径,也可以是相对路径。

    输出:类型是list型,然后就是输出相关的文件路径了

    import glob
    
    file = glob.glob(r&#39;C:\工具\*\*\pan*.exe&#39;)
    print(type(file))  # <class &#39;list&#39;>
    print(file)  # [&#39;C:\\工具\\PanDownload_v2.1.3\\PanDownload\\PanDownload.exe&#39;]
    
    #获取上级目录的所有.py文件
    print (glob.glob(r&#39;../*.py&#39;)) #相对路径

    2、glob.iglob:获取一个可遍历对象,使用它可以逐个获取匹配的文件路径名。

    与glob.glob()的区别是:glob.glob同时获取所有的匹配路径,而glob.iglob一次只获取一个匹配路径。

    下面是一个简单的例子:

    import glob
    
    #父目录中的.py文件
    f = glob.iglob(r&#39;../*.py&#39;)
    print ( f ) # <generator object iglob at 0x00B9FF80>
    for py in f:
       print  (py)

    以上是Python檔案處理方法、os模組和glob模組怎麼使用的詳細內容。更多資訊請關注PHP中文網其他相關文章!

    陳述
    本文轉載於:亿速云。如有侵權,請聯絡admin@php.cn刪除
    Python:遊戲,Guis等Python:遊戲,Guis等Apr 13, 2025 am 12:14 AM

    Python在遊戲和GUI開發中表現出色。 1)遊戲開發使用Pygame,提供繪圖、音頻等功能,適合創建2D遊戲。 2)GUI開發可選擇Tkinter或PyQt,Tkinter簡單易用,PyQt功能豐富,適合專業開發。

    Python vs.C:申請和用例Python vs.C:申請和用例Apr 12, 2025 am 12:01 AM

    Python适合数据科学、Web开发和自动化任务,而C 适用于系统编程、游戏开发和嵌入式系统。Python以简洁和强大的生态系统著称,C 则以高性能和底层控制能力闻名。

    2小時的Python計劃:一種現實的方法2小時的Python計劃:一種現實的方法Apr 11, 2025 am 12:04 AM

    2小時內可以學會Python的基本編程概念和技能。 1.學習變量和數據類型,2.掌握控制流(條件語句和循環),3.理解函數的定義和使用,4.通過簡單示例和代碼片段快速上手Python編程。

    Python:探索其主要應用程序Python:探索其主要應用程序Apr 10, 2025 am 09:41 AM

    Python在web開發、數據科學、機器學習、自動化和腳本編寫等領域有廣泛應用。 1)在web開發中,Django和Flask框架簡化了開發過程。 2)數據科學和機器學習領域,NumPy、Pandas、Scikit-learn和TensorFlow庫提供了強大支持。 3)自動化和腳本編寫方面,Python適用於自動化測試和系統管理等任務。

    您可以在2小時內學到多少python?您可以在2小時內學到多少python?Apr 09, 2025 pm 04:33 PM

    兩小時內可以學到Python的基礎知識。 1.學習變量和數據類型,2.掌握控制結構如if語句和循環,3.了解函數的定義和使用。這些將幫助你開始編寫簡單的Python程序。

    如何在10小時內通過項目和問題驅動的方式教計算機小白編程基礎?如何在10小時內通過項目和問題驅動的方式教計算機小白編程基礎?Apr 02, 2025 am 07:18 AM

    如何在10小時內教計算機小白編程基礎?如果你只有10個小時來教計算機小白一些編程知識,你會選擇教些什麼�...

    如何在使用 Fiddler Everywhere 進行中間人讀取時避免被瀏覽器檢測到?如何在使用 Fiddler Everywhere 進行中間人讀取時避免被瀏覽器檢測到?Apr 02, 2025 am 07:15 AM

    使用FiddlerEverywhere進行中間人讀取時如何避免被檢測到當你使用FiddlerEverywhere...

    Python 3.6加載Pickle文件報錯"__builtin__"模塊未找到怎麼辦?Python 3.6加載Pickle文件報錯"__builtin__"模塊未找到怎麼辦?Apr 02, 2025 am 07:12 AM

    Python3.6環境下加載Pickle文件報錯:ModuleNotFoundError:Nomodulenamed...

    See all articles

    熱AI工具

    Undresser.AI Undress

    Undresser.AI Undress

    人工智慧驅動的應用程序,用於創建逼真的裸體照片

    AI Clothes Remover

    AI Clothes Remover

    用於從照片中去除衣服的線上人工智慧工具。

    Undress AI Tool

    Undress AI Tool

    免費脫衣圖片

    Clothoff.io

    Clothoff.io

    AI脫衣器

    AI Hentai Generator

    AI Hentai Generator

    免費產生 AI 無盡。

    熱門文章

    R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
    3 週前By尊渡假赌尊渡假赌尊渡假赌
    R.E.P.O.最佳圖形設置
    3 週前By尊渡假赌尊渡假赌尊渡假赌
    R.E.P.O.如果您聽不到任何人,如何修復音頻
    3 週前By尊渡假赌尊渡假赌尊渡假赌
    WWE 2K25:如何解鎖Myrise中的所有內容
    4 週前By尊渡假赌尊渡假赌尊渡假赌

    熱工具

    MantisBT

    MantisBT

    Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

    記事本++7.3.1

    記事本++7.3.1

    好用且免費的程式碼編輯器

    MinGW - Minimalist GNU for Windows

    MinGW - Minimalist GNU for Windows

    這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

    PhpStorm Mac 版本

    PhpStorm Mac 版本

    最新(2018.2.1 )專業的PHP整合開發工具

    SublimeText3漢化版

    SublimeText3漢化版

    中文版,非常好用