Maison >développement back-end >Tutoriel Python >Comment diviser une chaîne en mots en utilisant Python ?

Comment diviser une chaîne en mots en utilisant Python ?

DDD
DDDoriginal
2024-11-09 20:48:02974parcourir

How do I split a string into words using Python?

Segmentation de chaîne en Python

En Python, vous pouvez utiliser la méthode str.split() pour diviser la chaîne en fonction du délimiteur Ou expression régulière pour la segmentation des mots. Par défaut, str.split() divisera la chaîne en fonction des caractères d'espacement (y compris les espaces, les tabulations et les nouvelles lignes).

Utiliser le délimiteur par défaut

Le code suivant montre comment diviser une chaîne en une liste de mots à l'aide du délimiteur par défaut :

text = "many   fancy word \nhello    \thi"
words = text.split()

print(words)
# 输出:['many', 'fancy', 'word', 'hello', 'hi']

Dans ce Par exemple, le texte de la chaîne est divisé en la liste de mots suivante : ['many', 'fancy', 'word', 'hello', 'hi'].

Utiliser un délimiteur d'expression régulière

Vous pouvez également spécifier une expression régulière comme délimiteur. Cela vous permet de tokeniser des chaînes basées sur des modèles plus complexes.

Le code suivant montre comment utiliser des expressions régulières pour diviser une chaîne en une liste de mots, où les caractères d'espacement ou plusieurs espaces consécutifs sont considérés comme des délimiteurs :

import re

text = "many   fancy word \nhello    \thi"
white_space_regex = r"\s+"
words = re.split(white_space_regex, text)

print(words)
# 输出:['many', 'fancy', 'word', 'hello', 'hi']

Ici, dans ce cas, l'expression régulière r"s" correspond à un ou plusieurs caractères d'espacement, elle divise donc la chaîne en une liste de mots, dont chacun a au moins un caractère d'espacement entre eux.

Notes

  • str.split() renvoie une liste de chaînes, pas un tuple.
  • Si le délimiteur n'existe pas dans la chaîne, str.split() renverra une liste à un élément contenant la chaîne d'origine.
  • Vous pouvez spécifier le nombre maximum de fractionnements comme deuxième paramètre de la méthode str.split().

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn