Maison >développement back-end >Tutoriel Python >Comment supprimer les caractères non-ASCII tout en préservant les points et les espaces ?

Comment supprimer les caractères non-ASCII tout en préservant les points et les espaces ?

DDD
DDDoriginal
2024-10-19 20:37:29987parcourir

How to Remove Non-ASCII Characters while Preserving Periods and Spaces?

Supprimer les caractères non-ASCII tout en préservant les points et les espaces

Le but est de traiter des données textuelles stockées dans un fichier .txt et d'en extraire un chaîne sans aucun caractère non-ASCII, tout en préservant les espaces et les points. Pour y parvenir, le code fourni définit une fonction onlyascii() qui détermine si un caractère doit être inclus en vérifiant sa valeur ASCII. Cependant, il supprime actuellement également les points et les espaces.

Pour modifier onlyascii() afin d'exempter les points et les espaces, nous pouvons exploiter le module string.printable de Python. string.printable contient un ensemble de caractères considérés comme imprimables, y compris des espaces et des points.

La définition mise à jour de onlyascii() utilisant string.printable serait :

def onlyascii(char):
    if ord(char) < 48 or ord(char) > 127 or char not in string.printable:
        return ''
    else:
        return char

En incorporant cette vérification dans onlyascii(), les caractères non imprimables, à l'exclusion des espaces et des points, seront filtrés.

Voici le code corrigé avec la fonction onlyascii() mise à jour :

def onlyascii(char):
    if ord(char) < 48 or ord(char) > 127 or char not in string.printable:
        return ''
    else:
        return char

def get_my_string(file_path):
    f=open(file_path,'r')
    data=f.read()
    f.close()
    filtered_data=filter(onlyascii, data)
    filtered_data = filtered_data.lower()
    return filtered_data

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn