0x01 文章背景
近期,筆者所在公司的某業務系統的儲存臨近極限,伺服器馬上就要跑不動了,由於該業務系統A包含多個子系統A1、A2、A3 . .. An,這些子系統的中間儲存檔案由於設計原因,都儲存在同一個父級目錄之內,唯一不同的是,不同子系統產生的檔案和資料夾的名字都以該子系統名稱開始。如A1子系統所產生的檔案命名方式均為A1xxxxxx, A2子系統所產生的檔名均為A2xxxxx。現在要刪除其中一些子系統的歷史文件,以釋放伺服器空間,幾十T的數據,存放在一起,手動刪除肯定不顯示,只能藉助程式自動化實現了,使用什麼呢?自然想到了python。其實單純刪文件這一需求我認為不值得長篇闊論,但是其中遇到了一些特殊有趣的問題和一些有意思的解決方案,所以想與諸位分享一下,比如windows系統下的超長文件刪除, 如從閱讀官方英文文件尋找解決方案等等,下面進入正題。
0x02 使用python 刪除檔案
使用python刪除檔案有很多方式,最直接也是最方便的方式就是呼叫內建函數:
- os.remove () 刪除檔案
- os.rmdir() 刪除一個空白資料夾
- shutil.rmtree() 刪除一個資料夾及該資料夾下所有內容(包括子目錄及檔案)
也就是,此問題的解決方案,核心就是圍繞上述三個函數的處理。轉到我們遇到的問題,業務系統A包含多個子系統A1、A2、A3 ... An,這些子系統的中間儲存檔案由於設計原因,都儲存在同一個父級目錄之內,唯一不同的是,不同子系統所產生的檔案和資料夾的名字都以該子系統名稱開始。如A1子系統產生的文件命名方式均為A1xxxxxx, A2子系統產生的文件名均為A2xxxxx,現在的目的就是要在該刪除指定子系統所產生的文件,保留其他子系統的文件。
將需求拆解下,實際上就是解決下列4個問題:
1.怎麼刪除一個檔案?
2.怎麼辨識一個檔案或資料夾是某個子系統產生的?
3.如何判斷一個路徑是檔案還是目錄?
4.如何定位所有指定的子系統所產生的檔案和資料夾?
對於問題1, 在本節開始就闡述過,使用 python 的內建函數進行刪除即可:
os.remove("path") # 删除指定文件 os.rmdir("path") # 删除一个空文件夹 shutil.rmtree("path") #删除一个文件夹及该文件夹下所有内容(包括子目录及文件)
對於問題2,由於特定子系統產生的文件和資料夾的命名方式都是固定的模式,如A1子系統產生的檔名均為A1xxxxx,故可透過關鍵字匹配的方式來辨識。一個可能的方式為:
if keywords in filepath: # 如果文件名包含关键字keywords os.remove(filepath) # 删除文件 else: pass
對於問題3,由於刪除目錄和刪除文件的方式不一致,故需要在刪除前判斷一個路徑是目錄還是文件,根據其類型選擇合適的刪除方式,這個在python 中可以使用**os.path.isdir()**之類的函數進行判斷,主要是下列函數:
os.path.isdir("path") # 返回true则为目录,false则为文件 os.path.isfile("path") # 返回true则为文件,false则为目录
對於問題4,如何定位所有要刪除的文件,這個問題實際上就是一個指定目錄檔案遍歷的問題,也就是如何遍歷一個指定目錄的所有資料夾及檔案。對於這個問題,一般有兩種解決方案,一是深度優先遍歷方式,一是廣度優先遍歷方式,兩種方式在本例中效率是一致的,因為我們最終都要遍歷所有的文件。另外,幸運的是,python實在是過於強大,其內建的函數已經幫助我們實現了一個廣度優先目錄遍歷方法,及 os.walk("path") 方法,該方法就是遍歷 path 目錄下的所有文件及資料夾,典型的用法如下:
import os path = "C:\A\" for root, dirs, files in os.walk(path): print(root) print(dirs) print(files)
上例中,root 代表目前遍歷到的路徑,dirs 表示目前路徑下所有的子目錄, files 表示目前路徑下的所有子檔案。透過這種方式就能全部遍歷指定目錄了。
問題都分解開了,以下將問題組合一下就完成程式碼實作.
最終的程式碼實作為:
import os import shutil path = "C:\A\" keyword = "A1" for root, dirs, files in os.walk(path): for dir in dirs: if keyword in dir: rmpath = os.path.join(root, dir) print("删除文件夹: %s" % rmpath) shutil.rmtree(rmpath) for file in files: if keyword in file: rmpath = os.path.join(root, file) print("删除文件: %s" % rmpath) os.remove(rmpath)
即透過廣度優先方式(os. walk())遍歷指定目錄,逐一判斷目錄下所有子目錄和檔案是否符合關鍵字條件,滿足就刪除。
運行效果為:
看似需求到此基本上就很好的解決了,但是實際測試中發現有的很深的目錄卻沒有刪除,刪除目錄時報了一個錯,錯誤描述如下:
Unexpected error: (< type 'exceptions.WindowsError'>, WindowsError(3, 'The system cannot find the path specified'), < traceback object at 0x0000000002714F88>)
大致意思就是python找不到这个路径,可是为什么呢?为此,我继续进行一番资料查询,后来大致定位了是由于文件路径过长导致的,是由于windows系统用户态的默认路径长度不能超过256个字节导致的。但是官方说256个字节是最长,但为何能创建超过256的呢,所以既然能创建,那就一定能删除,但是需要一些方法,经过一番学习,找到了好几种方法,下面介绍其中一种最为实用的方法,另外几个比如使用压缩软件压缩后删除(百度知道的结果)适合手动但不适合编程解决。这个方法在下一节中继续讲述。
0x03 windows 文件系统关于长路径文件的相关定义
为解决windows下的长文件删除的问题,最为权威的资料莫过于windows官方的描述,我阅读了微软关于文件名长度的这一块的定义及说明,找到解决方案,微软的原文如下:
关键意思如下:
1.Windows API 提供的文件路径理论上最长是 32767 个字节,普通状态下给用户使用是不超过256个字符,说是为了使用户操作更加方便。这里不得不吐槽一下了,确实操作方便了,但是方便的同时也可能带来不便,明明定义了32767这么长的字节,只给用256,未免太抠搜了一点
2.用户如果想要打破这个长度限制,可以通过一个特殊方式告诉windows系统自己想要使用超长文件,这个特殊的方式就是在绝对路径前加上** "?" **字符串。
3.这篇文档后面还有描述在windows10以后如何通过注册表的方式接触文件名长度限制,这里就没有截图了,因为不通用,win7怎么办呢?有兴趣的同学可以查看其原文链接阅读:https://docs.microsoft.com/en-US/windows/win32/fileio/maximum-file-path-limitation?tabs=cmd
好了,看到这,解决方法呼之欲出,其实简单得不能太简单,直接在绝对路径前加上一个"?"即可:
# 获取目标路径的绝对路径,并在路径前加上\?, # 以解除windows的文件长度限制 path = '\\?\' + os.path.abspath(path)
0x04 改造 python 程序,删除长路径文件
根据上一节,对python程序进一步进行改造,加入windows长文件名限制解除,最后的完美删除工具就成型了:
import os import shutil path = "C:\A\" keyword = "A1" # 获取目标路径的绝对路径,并在路径前加上\?, # 以解除windows的文件长度限制 path = '\\?\' + os.path.abspath(path) for root, dirs, files in os.walk(path): for dir in dirs: if keyword in dir: rmpath = os.path.join(root, dir) print("删除文件夹: %s" % rmpath) shutil.rmtree(rmpath) for file in files: if keyword in file: rmpath = os.path.join(root, file) print("删除文件: %s" % rmpath) os.remove(rmpath)
虽然代码很短,只添加了一行,但是这一行,却完成了一个超级核心的任务,真可谓是灵魂一行啊,最后该工具中如在生产环境中发挥了其出色的作用,使服务器继续运转如飞了。
0x04 总结思考
啰嗦的话就不多说了,说几点思考 :
1.遇到问题将问题进行分解,拆分成一个个小问题逐步击破 。
2.要善于阅读官方技术文档,有时候解决一个问题的核心可能很简单,代码可能也就一行两行,但是就是藏在某个角落,不仔细去阅读还真不一定找得出来 。
3.python是个好东西,要有将问题转化成使用python去解决的习惯,习惯成自然,python可能在工作中就发挥大作用了呢。
0x05 参考资料
1.https://docs.microsoft.com/en-US/windows/win32/fileio/maximum-file-path-limitation?tabs=cmd
2.https://stackoverflow.com/questions/6996603/how-to-delete-a-file-or-folder-in
以上是手把手使用 Python 刪除 Windows 下的長路徑文件的詳細內容。更多資訊請關注PHP中文網其他相關文章!

pythonlistscanStoryDatatepe,ArrayModulearRaysStoreOneType,and numpyArraySareSareAraysareSareAraysareSareComputations.1)列出sareversArversAtileButlessMemory-Felide.2)arraymoduleareareMogeMogeNareSaremogeNormogeNoreSoustAta.3)

WhenyouattempttostoreavalueofthewrongdatatypeinaPythonarray,you'llencounteraTypeError.Thisisduetothearraymodule'sstricttypeenforcement,whichrequiresallelementstobeofthesametypeasspecifiedbythetypecode.Forperformancereasons,arraysaremoreefficientthanl

pythonlistsarepartofthestAndArdLibrary,herilearRaysarenot.listsarebuilt-In,多功能,和Rused ForStoringCollections,而EasaraySaraySaraySaraysaraySaraySaraysaraySaraysarrayModuleandleandleandlesscommonlyusedDduetolimitedFunctionalityFunctionalityFunctionality。

ThescriptisrunningwiththewrongPythonversionduetoincorrectdefaultinterpretersettings.Tofixthis:1)CheckthedefaultPythonversionusingpython--versionorpython3--version.2)Usevirtualenvironmentsbycreatingonewithpython3.9-mvenvmyenv,activatingit,andverifying

Pythonarrayssupportvariousoperations:1)Slicingextractssubsets,2)Appending/Extendingaddselements,3)Insertingplaceselementsatspecificpositions,4)Removingdeleteselements,5)Sorting/Reversingchangesorder,and6)Listcomprehensionscreatenewlistsbasedonexistin

NumPyarraysareessentialforapplicationsrequiringefficientnumericalcomputationsanddatamanipulation.Theyarecrucialindatascience,machinelearning,physics,engineering,andfinanceduetotheirabilitytohandlelarge-scaledataefficiently.Forexample,infinancialanaly

useanArray.ArarayoveralistinpythonwhendeAlingwithHomoGeneData,performance-Caliticalcode,orinterfacingwithccode.1)同質性data:arraysSaveMemorywithTypedElements.2)績效code-performance-calitialcode-calliginal-clitical-clitical-calligation-Critical-Code:Arraysofferferbetterperbetterperperformanceformanceformancefornallancefornalumericalical.3)

不,notalllistoperationsareSupportedByArrays,andviceversa.1)arraysdonotsupportdynamicoperationslikeappendorinsertwithoutresizing,wheremactsperformance.2)listssdonotguaranteeconecontanttanttanttanttanttanttanttanttanttimecomplecomecomplecomecomecomecomecomecomplecomectacccesslectaccesslecrectaccesslerikearraysodo。


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器

SublimeText3 Linux新版
SublimeText3 Linux最新版

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),