Maison  >  Article  >  développement back-end  >  Comment implémenter un classificateur de fichiers basé sur Python

Comment implémenter un classificateur de fichiers basé sur Python

王林
王林avant
2023-06-03 16:46:031525parcourir

En personnalisant le répertoire de fichiers à trier, tous les fichiers du répertoire peuvent être classés en fonction du format de fichier.

Comment implémenter un classificateur de fichiers basé sur Python

La pile technologique Python utilisée pour implémenter la logique est l'utilisation complète des trois bibliothèques standard d'os, glob et Shutil pour compléter l'organisation automatisée des fichiers.

Importez respectivement ces trois modules de traitement de fichiers dans le bloc de code et entrez les opérations de développement ultérieures.

# It imports the os module.
import os

# Shutil is a module that provides a number of high-level operations on files and collections of files.
import shutil

# The glob module finds all the pathnames matching a specified pattern according to the rules used by the Unix shell,
# although results are returned in arbitrary order. No tilde expansion is done, but *, ?, and character ranges expressed
# with [] will be correctly matched.
import glob
import sys

Définissez le uncatched_dir du répertoire de fichiers qui doit être classé et le target_dir du répertoire de stockage de fichiers classifiés afin qu'ils puissent être saisis manuellement.

# Asking the user to input the path of the directory that contains the files to be sorted.
uncatched_dir = input('请输入待分类的文件路径:\n')

# It checks if the uncatched_dir is empty.
if uncatched_dir.strip() == '':
    print('待分类的文件夹路径不能为空!')
    sys.exit()

# Asking the user to input the path of the directory that contains the files to be sorted.
target_dir = input('请输入分类后文件存放的目标路径:\n')

# It checks if the target_dir is empty.
if target_dir.strip() == '':
    print('分类后的文件存放路径不能为空!')
    sys.exit()

Comment implémenter un classificateur de fichiers basé sur Python

Vérifiez si le chemin du répertoire de stockage de fichiers saisi après classification existe, car il est probable qu'il entre un nouveau chemin, et s'il n'existe pas, créez un nouveau chemin.

# It checks if the target_dir exists. If it does not exist, it creates a new directory in the current working directory.
if not os.path.exists(target_dir):
    # It creates a new directory in the current working directory.
    os.mkdir(target_dir)

Définissez une variable file_move_num pour le nombre de fichiers déplacés et une variable dir_new_num pour le nombre de dossiers nouvellement créés pour enregistrer les résultats du tri des fichiers.

# A variable that is used to count the number of files that have been moved.
file_move_num = 0

# A variable that is used to count the number of new directories that have been created.
dir_new_num = 0

Parcourez le répertoire du dossier uncatched_dir qui doit être trié et triez automatiquement tous les types de fichiers sous le répertoire.

# A for loop that iterates through all the files in the uncatched_dir directory.
for file_ in glob.glob(f'{uncatched_dir}/**/*', recursive=True):

    # It checks if the file is a file.
    if os.path.isfile(file_):

        # It gets the file name of the file.
        file_name = os.path.basename(file_)

        # Checking if the file name contains a period.
        if '.' in file_name:

            # Getting the suffix of the file.
            suffix_name = file_name.split('.')[-1]

        else:

            # Used to classify files that do not have a suffix.
            suffix_name = 'others'

        # It checks if the directory exists. If it does not exist, it creates a new directory in the current working
        # directory.
        if not os.path.exists(f'{target_dir}/{suffix_name}'):

            # It creates a new directory in the current working directory.
            os.mkdir(f'{target_dir}/{suffix_name}')

            # Adding 1 to the variable dir_new_num.
            dir_new_num += 1

        # It copies the file to the target directory.
        shutil.copy(file_, f'{target_dir}/{suffix_name}')

        # Adding 1 to the variable file_move_num.
        file_move_num += 1

Remarque : Afin d'éviter les exceptions causées par le déplacement de dossiers, en particulier les disques système, la copie est utilisée ici, qui est la fonction shutdown.copy.

Enfin, utilisez la fonction d'impression pour imprimer le nombre de catégories de fichiers et le nombre de nouveaux dossiers.

print(f'整理完成,有{file_move_num}个文件分类到了{dir_new_num}个文件夹中!\n')

input('输入任意键关闭窗口...')

Afin d'éviter de fermer la fenêtre de commande directement une fois l'exécution du programme terminée, la fonction de saisie est utilisée ci-dessus pour maintenir l'effet de la fenêtre en pause.

Comment implémenter un classificateur de fichiers basé sur Python

Comment implémenter un classificateur de fichiers basé sur Python

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer