Maison >développement back-end >Tutoriel Python >Comment puis-je supprimer les accents des chaînes Unicode en Python ?

Comment puis-je supprimer les accents des chaînes Unicode en Python ?

Linda Hamilton
Linda Hamiltonoriginal
2024-12-27 06:10:10599parcourir

How Can I Remove Accents from Unicode Strings in Python?

Supprimer les accents (normaliser) dans une chaîne Unicode Python

Supprimer les accents (diacritiques) d'une chaîne Unicode implique de la convertir dans sa forme longue normalisée , où les lettres et les signes diacritiques ont des caractères distincts. Par la suite, les caractères diacritiques sont supprimés pour obtenir la chaîne normalisée souhaitée.

Utilisation de la bibliothèque standard Python

Malheureusement, la bibliothèque standard Python ne fournit pas de solution directe pour l'accent suppression dans les chaînes Unicode. Cependant, vous pouvez utiliser le module unicodedata pour obtenir des informations sur les caractères et modifier la chaîne en conséquence.

Utilisation de bibliothèques tierces

Pour une solution plus pratique et plus complète, des bibliothèques tierces Des bibliothèques tierces comme pyICU peuvent être utilisées. Voici un exemple utilisant unidecode :

import unidecode

accented_string = 'kožušček'
normalized_string = unidecode.unidecode(accented_string)

print(normalized_string)  # Output: 'kozuscek'

Détails de mise en œuvre

unidecode translittère les caractères Unicode en leurs équivalents ASCII les plus proches. Il utilise une table de mappage complète pour convertir les caractères accentués en leurs formes de base. Contrairement aux approches de mappage explicite, il gère un large éventail de caractères Unicode, y compris ceux qui ne sont pas couramment utilisés.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn