Maison >développement back-end >Tutoriel Python >Comment supprimer les caractères indésirables d'une chaîne en python

Comment supprimer les caractères indésirables d'une chaîne en python

不言original: 2018-05-02 15:32:554204parcourir

Cet article présente principalement en détail comment Python supprime les caractères indésirables des chaînes. Il a une certaine valeur de référence. Les amis intéressés peuvent s'y référer

Question :

Filtre. les espaces blancs supplémentaires avant et après la saisie de l'utilisateur

> Comment résoudre les problèmes ci-dessus ?

Supprimez les deux extrémités de la chaîne : strip(), rstrip(),lstrip()

Supprimer un Caractères de position fixes uniques : tranchage + épissage

Supprimer des caractères à n'importe quelle position et supprimer plusieurs caractères différents en même temps : remplacer(), re. sub()

#!/usr/bin/python3
 
s = &#39; -----abc123++++  &#39;
 
# 删除两边空字符
print(s.strip())
 
# 删除左边空字符
print(s.rstrip())
 
# 删除右边空字符
print(s.lstrip())
 
# 删除两边 - + 和空字符
print(s.strip().strip(&#39;-+&#39;))

Supprimer plusieurs caractères différents en même temps : translate()

#!/usr/bin/python3
 
s = &#39;abc:123&#39;
# 字符串拼接方式去除冒号
new_s = s[:3] + s[4:]
print(new_s)

Supprimer le tons en caractères Unicode

#!/usr/bin/python3
 
# 去除字符串中相同的字符
s = &#39;\tabc\t123\tisk&#39;
print(s.replace(&#39;\t&#39;, &#39;&#39;))
 
 
import re
# 去除\r\n\t字符
s = &#39;\r\nabc\t123\nxyz&#39;
print(re.sub(&#39;[\r\n\t]&#39;, &#39;&#39;, s))

Recommandations associées :

python corrigé selon la méthode de division de la chaîne par longueur

#!/usr/bin/python3
 
s = &#39;abc123xyz&#39;
# a _> x, b_> y, c_> z，字符映射加密
print(str.maketrans(&#39;abcxyz&#39;, &#39;xyzabc&#39;))
# translate把其转换成字符串
print(s.translate(str.maketrans(&#39;abcxyz&#39;, &#39;xyzabc&#39;)))

#!/usr/bin/python3
 
import sys
import unicodedata
s = "Zhào Qián Sūn Lǐ Zhōu Wú Zhèng Wáng"
remap = {
 # ord返回ascii值
 ord(&#39;\t&#39;): &#39;&#39;,
 ord(&#39;\f&#39;): &#39;&#39;,
 ord(&#39;\r&#39;): None
 }
# 去除\t, \f, \r
a = s.translate(remap)
&#39;&#39;&#39;
　　通过使用dict.fromkeys() 方法构造一个字典，每个Unicode 和音符作为键，对于的值全部为None
　　然后使用unicodedata.normalize() 将原始输入标准化为分解形式字符
　　sys.maxunicode : 给出最大Unicode代码点的值的整数，即1114111（十六进制的0x10FFFF）。
　　unicodedata.combining:将分配给字符chr的规范组合类作为整数返回。 如果未定义组合类，则返回0。
&#39;&#39;&#39;
cmb_chrs = dict.fromkeys(c for c in range(sys.maxunicode) if unicodedata.combining(chr(c))) #此部分建议拆分开来理解
b = unicodedata.normalize(&#39;NFD&#39;, a)
&#39;&#39;&#39;
　　　调用translate 函数删除所有重音符
&#39;&#39;&#39;
print(b.translate(cmb_chrs))

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration：

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article précédent：Comment utiliser Python pour ouvrir Excel via Win32 COM et ajouter une feuilleArticle suivant：Comment utiliser Python pour ouvrir Excel via Win32 COM et ajouter une feuille

Articles Liés

Voir plus