遞歸子資料夾搜尋和檔案清單
經常會遇到需要遍歷多個子資料夾並根據子資料夾提取特定檔案的場景他們的檔案副檔名。解決此問題的一種方法是利用 Python 的內建 os.walk 函數,該函數可以遞歸探索目錄及其內容。
但是,正如在此問題中遇到的那樣,在嘗試連接目錄時會出現問題行為。文件的路徑。 os.walk 傳回的 subFolder 變數表示子資料夾列表,而不是每個檔案所在的特定資料夾。
要解決此問題,正確的方法是使用 dirpath(或給定程式碼中的 root) ,它表示迭代的當前目錄。 dirpath 值應與檔案名稱連接起來以建構完整的檔案路徑。
此外,考慮其他因素也很重要,例如從遞歸過程中修剪某些資料夾,這可以透過檢查 dn 來實現(目錄名稱)清單。為了避免依賴字串操作進行檔案副檔名檢查,您可以利用 os.path.splitext 函數。
以下是包含這些增強功能的程式碼的最佳化版本:
<code class="python">import os result = [ os.path.join(dp, f) for dp, dn, filenames in os.walk(PATH) for f in filenames if os.path.splitext(f)[1] == ".txt" ]</code>
作為替代方案,glob 是另一個強大的工具,可用於根據副檔名選擇檔案。以下是使用 glob 的範例:
<code class="python">import os from glob import glob result = [ y for x in os.walk(PATH) for y in glob(os.path.join(x[0], "*.txt")) ]</code>
對於 Python 3.4 ,Pathlib 為此任務提供了直觀的方法:
<code class="python">from pathlib import Path result = list(Path(".").rglob("*.[tT][xX][tT]"))</code>
以上是如何使用 Python 有效地搜尋和列出子資料夾中的檔案?的詳細內容。更多資訊請關注PHP中文網其他相關文章!