Maison  >  Article  >  développement back-end  >  En Python, comment diviser une chaîne contenant plusieurs délimiteurs ?

En Python, comment diviser une chaîne contenant plusieurs délimiteurs ?

WBOY
WBOYavant
2023-05-09 19:25:062440parcourir

Pour diviser une chaîne en utilisant plusieurs délimiteurs :

Utilisez la méthode re.split(), par exemple re.split(r',|-', my_str). La méthode re.split() 方法,例如 re.split(r',|-', my_str)

re.split() 方法将拆分所有出现的分隔符之一的字符串。

import re
# ????️ 用 2 个分隔符拆分字符串
my_str = 'fql,jiyik-dot,com'
my_list = re.split(r',|-', my_str)  # ????️ 以逗号或连字符分隔
print(my_list)  # ????️ ['fql', 'jiyik', 'dot', 'com']

re.split 方法接受一个模式和一个字符串,并在每次出现该模式时拆分字符串。

管道 | 字符是一个或。 匹配 A 或 B。

该示例使用 2 个分隔符(逗号和连字符)拆分字符串。

# ????️ 用 3 个分隔符拆分字符串
my_str = 'fql,jiyik-dot:com'
my_list = re.split(r',|-|:', my_str)  # ????️ comma, hyphen or colon
print(my_list)  # ????️ ['fql', 'jiyik', 'dot', 'com']

下面是一个使用 3 个分隔符(逗号、连字符和冒号)拆分字符串的示例。

我们可以使用尽可能多的 | 正则表达式中必要的字符。

使用方括号 [] 根据多个定界符拆分字符串

或者,我们可以使用方括号 [] 来指示一组字符。

import re
my_str = 'fql,jiyik-dot,com'
my_list = re.split(r'[,-]', my_str)
print(my_list)  # ????️ ['fql', 'jiyik', 'dot', 'com']

En Python, comment diviser une chaîne contenant plusieurs délimiteurs ?

确保在方括号之间添加所有分隔符。

import re
# ????️ 用 3 个分隔符拆分字符串
my_str = 'fql,jiyik-dot:com'
my_list = re.split(r'[,-:]', my_str) # 以逗号、连字符、冒号分割
print(my_list)  # ????️ ['fql', 'jiyik', 'dot', 'com']

如果字符串以其中一个定界符开头或结尾,我们可能会在输出列表中得到空字符串值。

处理前导或尾随定界符

我们可以使用列表理解从列表中删除任何空字符串。

import re

# ????️ 用 3 个分隔符拆分字符串
my_str = ',fql,jiyik-dot:com:'

my_list = [
    item for item in re.split(r'[,-:]', my_str)
    if item
]

print(my_list)  # ????️ ['fql', 'jiyik', 'dot', 'com']

列表推导负责从列表中删除空字符串。

列表推导用于对每个元素执行某些操作或选择满足条件的元素子集。

另一种方法是使用 str.replace() 方法。

使用 str.replace() 拆分具有多个定界符的字符串

要使用多个定界符拆分字符串:

  • 使用 str.replace() 方法将第一个分隔符替换为第二个分隔符。

  • 使用 str.split() 方法按第二个分隔符拆分字符串。

my_str = 'fql_jiyik!dot_com'
my_list = my_str.replace('_', '!').split('!')
print(my_list)  # ????️ ['fql', 'jiyik', 'dot', 'com']

这种方法仅在您想要拆分的分隔符很少时才方便,例如 2.

首先,我们用第二个分隔符替换每个出现的第一个分隔符,然后我们拆分第二个分隔符。

str.replace 方法返回字符串的副本,其中所有出现的子字符串都被提供的替换项替换。

该方法采用以下参数:

  • old 字符串中我们要替换的子串

  • new 替换每次出现的 old

  • count 仅替换第一个 count 出现(可选)

请注意 ,该方法不会更改原始字符串。 字符串在 Python 中是不可变的。

这是另一个例子。

my_str = 'fql jiyik, dot # com. abc'

my_list = my_str.replace(
    ',', '').replace(
    '#', '').replace('.', '').split()

print(my_list)  # ????️ ['fql', 'jiyik', 'dot', 'com', 'abc']

我们使用 str.replace() 方法在拆分空白字符的字符串之前删除标点符号。

我们使用空字符串进行替换,因为我们要删除指定的字符。

我们可以根据需要将尽可能多的调用链接到 str.replace() 方法。

最后一步是使用 str.split() 方法将字符串拆分为单词列表。

str.split() 方法使用定界符将字符串拆分为子字符串列表。

该方法采用以下 2 个参数:

  • separator 在每次出现分隔符时将字符串拆分为子字符串

  • maxsplit 最多完成 maxsplit 拆分(可选)

当没有分隔符传递给 str.split() 方法时,它会将输入字符串拆分为一个或多个空白字符。

my_str = 'fql jiyik com'
print(my_str.split())  # ????️ ['fql', 'jiyik', 'com']

如果在字符串中找不到分隔符,则返回仅包含 1 个元素的列表。

使用可重用函数根据多个定界符拆分字符串

如果我们需要经常根据多个分隔符拆分字符串,请定义一个可重用的函数。

import re

def split_multiple(string, delimiters):
    pattern = '|'.join(map(re.escape, delimiters))

    return re.split(pattern, string)

my_str = 'fql,jiyik-dot:com'

print(split_multiple(my_str, [',', '-', ':']))

split_multiple 函数接受一个字符串和一个分隔符列表,并根据分隔符拆分字符串。

str.join() 方法用于将分隔符与管道 | 连接起来。 分隔器。

# ????️ ,|-|:
print('|'.join([',', '-', ':']))

这将创建一个正则表达式模式,我们可以使用该模式根据指定的分隔符拆分字符串。

如果我们需要将一个字符串拆分为多个分隔符的单词列表,我们还可以使用 re.findall() 方法。

使用 re.findall() 将字符串拆分为单词列表

使用 re.findall() 方法将字符串拆分为具有多个分隔符的单词列表。

re.findall() 方法将在每次出现单词时拆分字符串,并返回包含单词的列表。

import re

# ✅ 将字符串拆分为具有多个分隔符的单词列表
my_str = 'fql jiyik, dot # com. abc'

my_list = re.findall(r'[\w]+', my_str)
print(my_list)  # ????️ ['fql', 'jiyik', 'dot', 'com', 'abc']

re.findall

re.split() divisera toutes les occurrences d'une chaîne avec l'un des délimiteurs. La méthode 🎜
import re

my_str = 'fql jiyik, dot # com. abc'

my_list = re.findall(r'[\w]+', my_str)
print(my_list)  # ????️ ['fql', 'jiyik', 'dot', 'com', 'abc']
🎜re.split accepte un modèle et une chaîne et divise la chaîne à chaque fois que le modèle apparaît. 🎜🎜Le personnage Pipe | est un ou. Correspond à A ou B. 🎜🎜Cet exemple divise une chaîne en utilisant 2 délimiteurs (virgule et trait d'union). 🎜rrreee🎜Voici un exemple de fractionnement d'une chaîne à l'aide de 3 délimiteurs (virgule, trait d'union et deux-points). 🎜🎜Nous pouvons utiliser autant de caractères | que nécessaire dans l'expression régulière. 🎜

Utilisez des crochets [] pour diviser une chaîne en fonction de plusieurs délimiteurs

🎜Alternativement, nous pouvons utiliser des crochets [] pour indiquer un groupe de caractères. 🎜rrreee🎜Comment diviser une chaîne avec plusieurs délimiteurs en Python🎜🎜 Assurez-vous d'ajouter tous les délimiteurs entre crochets. 🎜rrreee🎜Si la chaîne commence ou se termine par l'un de ces délimiteurs, nous pouvons obtenir des valeurs de chaîne vides dans la liste de sortie. 🎜

Gestion des délimiteurs de début ou de fin

🎜Nous pouvons utiliser la compréhension de liste pour supprimer toute chaîne vide de la liste. 🎜rrreee🎜La compréhension de liste est responsable de la suppression des chaînes vides d'une liste. 🎜
🎜Les compréhensions de liste sont utilisées pour effectuer certaines opérations sur chaque élément ou sélectionner un sous-ensemble d'éléments qui satisfont une condition. 🎜
🎜Une autre façon consiste à utiliser la méthode str.replace(). 🎜

Diviser une chaîne avec plusieurs délimiteurs à l'aide de str.replace()

🎜Pour diviser une chaîne avec plusieurs délimiteurs : 🎜
  • 🎜Utilisez le str.replace() pour remplacer le premier délimiteur par le deuxième délimiteur. 🎜
  • 🎜Utilisez la méthode str.split() pour diviser la chaîne par le deuxième délimiteur. 🎜
rrreee
🎜Cette méthode n'est pratique que lorsque vous souhaitez diviser avec quelques délimiteurs, comme 2.🎜
🎜Tout d'abord, nous délimitons avec le deuxième caractère qui remplace chaque occurrence du premier délimiteur, puis nous nous séparons sur le deuxième délimiteur. La méthode 🎜🎜str.replace renvoie une copie de la chaîne avec toutes les occurrences de la sous-chaîne remplacées par le remplacement fourni. 🎜🎜Cette méthode prend les paramètres suivants : 🎜
  • 🎜old La sous-chaîne que nous voulons remplacer dans la chaîne 🎜
  • 🎜new Remplacez chaque occurrence de old🎜
  • 🎜count Remplacez uniquement la première occurrence de count (facultatif) 🎜
  • ul >
    🎜Veuillez noter que cette méthode ne modifie pas la chaîne d'origine. Les chaînes sont immuables en Python. 🎜
    🎜Voici un autre exemple. 🎜rrreee🎜Nous utilisons la méthode str.replace() pour supprimer la ponctuation avant de diviser la chaîne en caractères d'espacement. 🎜
    🎜Nous utilisons une chaîne vide pour le remplacement car nous souhaitons supprimer les caractères spécifiés. 🎜
    🎜Nous pouvons enchaîner autant d'appels à la méthode str.replace() que nécessaire. 🎜🎜La dernière étape consiste à diviser la chaîne en une liste de mots à l'aide de la méthode str.split(). La méthode 🎜🎜str.split() divise une chaîne en une liste de sous-chaînes à l'aide de délimiteurs. 🎜🎜Cette méthode prend les 2 paramètres suivants : 🎜
    • 🎜separator divise la chaîne en sous-caractères à chaque fois qu'un séparateur apparaît String 🎜
    • 🎜maxsplit Division complète de maxsplit (facultatif) 🎜
    🎜Lorsqu'aucun délimiteur n'est transmis à la méthode str.split( ) , il divise la chaîne d'entrée en un ou plusieurs caractères d'espacement. 🎜rrreee🎜Si le délimiteur n'est pas trouvé dans la chaîne, renvoie une liste contenant seulement 1 élément. 🎜

    Utilisez la fonction réutilisable pour diviser une chaîne en fonction de plusieurs délimiteurs

    🎜Si nous devons fréquemment diviser une chaîne en fonction de plusieurs délimiteurs, veuillez définir une fonction réutilisable. La fonction 🎜rrreee🎜split_multiple accepte une chaîne et une liste de délimiteurs et divise la chaîne en fonction du délimiteur. 🎜🎜La méthode str.join() est utilisée pour joindre le délimiteur avec le tube |. Diviseur. 🎜rrreee🎜Cela créera un modèle d'expression régulière que nous pourrons utiliser pour diviser une chaîne en fonction d'un délimiteur spécifié. 🎜🎜Si nous devons diviser une chaîne en une liste de mots avec plusieurs délimiteurs, nous pouvons également utiliser la méthode re.findall(). 🎜

    Divisez une chaîne en une liste de mots à l'aide de re.findall()

    🎜Utilisez la méthode re.findall() pour diviser une chaîne en mots avec une liste de plusieurs délimiteurs. La méthode 🎜🎜re.findall() divisera la chaîne à chaque fois qu'un mot apparaît et renverra une liste contenant le mot. La méthode 🎜rrreee🎜re.findall prend un motif et une chaîne comme paramètres et renvoie une liste de chaînes contenant toutes les occurrences qui ne se chevauchent pas du motif dans la chaîne. 🎜

    我们传递给 re.findall() 方法的第一个参数是一个正则表达式。

    import re
    
    my_str = 'fql jiyik, dot # com. abc'
    
    my_list = re.findall(r'[\w]+', my_str)
    print(my_list)  # ????️ ['fql', 'jiyik', 'dot', 'com', 'abc']

    方括号 [] 用于表示一组字符。

    \w 字符与 Unicode 单词字符匹配,并且包括可以作为任何语言的单词一部分的大多数字符。

    加号 + 使正则表达式匹配前面字符(Unicode 字符)的 1 次或多次重复。

    re.findall() 方法返回一个包含字符串中单词的列表。

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer