>  기사  >  백엔드 개발  >  Python에서 여러 구분 기호가 포함된 문자열을 어떻게 분할합니까?

Python에서 여러 구분 기호가 포함된 문자열을 어떻게 분할합니까?

WBOY
WBOY앞으로
2023-05-09 19:25:062533검색

여러 구분 기호를 사용하여 문자열을 분할하려면:

re.split() 메서드를 사용하세요(예: re.split(r',|-', my_str)). re.split() 方法,例如 re.split(r',|-', my_str)

re.split() 方法将拆分所有出现的分隔符之一的字符串。

import re
# ????️ 用 2 个分隔符拆分字符串
my_str = 'fql,jiyik-dot,com'
my_list = re.split(r',|-', my_str)  # ????️ 以逗号或连字符分隔
print(my_list)  # ????️ ['fql', 'jiyik', 'dot', 'com']

re.split 方法接受一个模式和一个字符串,并在每次出现该模式时拆分字符串。

管道 | 字符是一个或。 匹配 A 或 B。

该示例使用 2 个分隔符(逗号和连字符)拆分字符串。

# ????️ 用 3 个分隔符拆分字符串
my_str = 'fql,jiyik-dot:com'
my_list = re.split(r',|-|:', my_str)  # ????️ comma, hyphen or colon
print(my_list)  # ????️ ['fql', 'jiyik', 'dot', 'com']

下面是一个使用 3 个分隔符(逗号、连字符和冒号)拆分字符串的示例。

我们可以使用尽可能多的 | 正则表达式中必要的字符。

使用方括号 [] 根据多个定界符拆分字符串

或者,我们可以使用方括号 [] 来指示一组字符。

import re
my_str = 'fql,jiyik-dot,com'
my_list = re.split(r'[,-]', my_str)
print(my_list)  # ????️ ['fql', 'jiyik', 'dot', 'com']

Python에서 여러 구분 기호가 포함된 문자열을 어떻게 분할합니까?

确保在方括号之间添加所有分隔符。

import re
# ????️ 用 3 个分隔符拆分字符串
my_str = 'fql,jiyik-dot:com'
my_list = re.split(r'[,-:]', my_str) # 以逗号、连字符、冒号分割
print(my_list)  # ????️ ['fql', 'jiyik', 'dot', 'com']

如果字符串以其中一个定界符开头或结尾,我们可能会在输出列表中得到空字符串值。

处理前导或尾随定界符

我们可以使用列表理解从列表中删除任何空字符串。

import re

# ????️ 用 3 个分隔符拆分字符串
my_str = ',fql,jiyik-dot:com:'

my_list = [
    item for item in re.split(r'[,-:]', my_str)
    if item
]

print(my_list)  # ????️ ['fql', 'jiyik', 'dot', 'com']

列表推导负责从列表中删除空字符串。

列表推导用于对每个元素执行某些操作或选择满足条件的元素子集。

另一种方法是使用 str.replace() 方法。

使用 str.replace() 拆分具有多个定界符的字符串

要使用多个定界符拆分字符串:

  • 使用 str.replace() 方法将第一个分隔符替换为第二个分隔符。

  • 使用 str.split() 方法按第二个分隔符拆分字符串。

my_str = 'fql_jiyik!dot_com'
my_list = my_str.replace('_', '!').split('!')
print(my_list)  # ????️ ['fql', 'jiyik', 'dot', 'com']

这种方法仅在您想要拆分的分隔符很少时才方便,例如 2.

首先,我们用第二个分隔符替换每个出现的第一个分隔符,然后我们拆分第二个分隔符。

str.replace 方法返回字符串的副本,其中所有出现的子字符串都被提供的替换项替换。

该方法采用以下参数:

  • old 字符串中我们要替换的子串

  • new 替换每次出现的 old

  • count 仅替换第一个 count 出现(可选)

请注意 ,该方法不会更改原始字符串。 字符串在 Python 中是不可变的。

这是另一个例子。

my_str = 'fql jiyik, dot # com. abc'

my_list = my_str.replace(
    ',', '').replace(
    '#', '').replace('.', '').split()

print(my_list)  # ????️ ['fql', 'jiyik', 'dot', 'com', 'abc']

我们使用 str.replace() 方法在拆分空白字符的字符串之前删除标点符号。

我们使用空字符串进行替换,因为我们要删除指定的字符。

我们可以根据需要将尽可能多的调用链接到 str.replace() 方法。

最后一步是使用 str.split() 方法将字符串拆分为单词列表。

str.split() 方法使用定界符将字符串拆分为子字符串列表。

该方法采用以下 2 个参数:

  • separator 在每次出现分隔符时将字符串拆分为子字符串

  • maxsplit 最多完成 maxsplit 拆分(可选)

当没有分隔符传递给 str.split() 方法时,它会将输入字符串拆分为一个或多个空白字符。

my_str = 'fql jiyik com'
print(my_str.split())  # ????️ ['fql', 'jiyik', 'com']

如果在字符串中找不到分隔符,则返回仅包含 1 个元素的列表。

使用可重用函数根据多个定界符拆分字符串

如果我们需要经常根据多个分隔符拆分字符串,请定义一个可重用的函数。

import re

def split_multiple(string, delimiters):
    pattern = '|'.join(map(re.escape, delimiters))

    return re.split(pattern, string)

my_str = 'fql,jiyik-dot:com'

print(split_multiple(my_str, [',', '-', ':']))

split_multiple 函数接受一个字符串和一个分隔符列表,并根据分隔符拆分字符串。

str.join() 方法用于将分隔符与管道 | 连接起来。 分隔器。

# ????️ ,|-|:
print('|'.join([',', '-', ':']))

这将创建一个正则表达式模式,我们可以使用该模式根据指定的分隔符拆分字符串。

如果我们需要将一个字符串拆分为多个分隔符的单词列表,我们还可以使用 re.findall() 方法。

使用 re.findall() 将字符串拆分为单词列表

使用 re.findall() 方法将字符串拆分为具有多个分隔符的单词列表。

re.findall() 方法将在每次出现单词时拆分字符串,并返回包含单词的列表。

import re

# ✅ 将字符串拆分为具有多个分隔符的单词列表
my_str = 'fql jiyik, dot # com. abc'

my_list = re.findall(r'[\w]+', my_str)
print(my_list)  # ????️ ['fql', 'jiyik', 'dot', 'com', 'abc']

re.findall

re.split() 메서드는 모든 문자열을 구분 기호 중 하나로 분할합니다. 🎜
import re

my_str = 'fql jiyik, dot # com. abc'

my_list = re.findall(r'[\w]+', my_str)
print(my_list)  # ????️ ['fql', 'jiyik', 'dot', 'com', 'abc']
🎜re.split 메서드는 패턴과 문자열을 허용하고 패턴이 발생할 때마다 문자열을 분할합니다. 🎜🎜파이프 문자는 또는입니다. A 또는 B와 일치합니다. 🎜🎜이 예는 2개의 구분 기호(쉼표와 하이픈)를 사용하여 문자열을 분할합니다. 🎜rrreee🎜다음은 3개의 구분 기호(쉼표, 하이픈, 콜론)를 사용하여 문자열을 분할하는 예입니다. 🎜🎜정규 표현식에 필요한 만큼 | 문자를 사용할 수 있습니다. 🎜

여러 구분 기호를 기준으로 문자열을 분할하려면 대괄호 []를 사용하세요.

🎜또는 대괄호 []를 사용하여 문자 그룹을 나타낼 수도 있습니다. 🎜rrreee🎜Python에서 여러 구분 기호로 문자열을 분할하는 방법🎜🎜 대괄호 사이에 모든 구분 기호를 추가해야 합니다. 🎜rrreee🎜문자열이 이러한 구분 기호 중 하나로 시작하거나 끝나는 경우 출력 목록에 빈 문자열 값이 나타날 수 있습니다. 🎜

선행 또는 후행 구분 기호 처리

🎜목록 이해를 사용하여 목록에서 빈 문자열을 제거할 수 있습니다. 🎜rrreee🎜List Comprehension은 목록에서 빈 문자열을 제거하는 역할을 합니다. 🎜
🎜List comprehension은 각 요소에 대해 특정 작업을 수행하거나 조건을 만족하는 요소의 하위 집합을 선택하는 데 사용됩니다. 🎜
🎜또 다른 방법은 str.replace() 메서드를 사용하는 것입니다. 🎜

str.replace()를 사용하여 문자열을 여러 구분 기호로 분할

🎜문자열을 여러 구분 기호로 분할하려면: 🎜
  • 🎜 str.replace() 메서드를 사용하면 첫 번째 구분 기호를 두 번째 구분 기호로 바꿀 수 있습니다. 🎜
  • 🎜두 번째 구분 기호로 문자열을 분할하려면 str.split() 메서드를 사용하세요. 🎜
rrreee
🎜이 방법은 2와 같은 소수의 구분 기호로 분할하려는 경우에만 편리합니다.🎜
🎜먼저 두 번째 문자로 분할하여 각 항목을 대체합니다. 첫 번째 구분 기호를 사용하고 두 번째 구분 기호로 분할합니다. 🎜🎜str.replace 메서드는 제공된 대체 문자열로 대체된 모든 하위 문자열이 포함된 문자열의 복사본을 반환합니다. 🎜🎜이 메소드는 다음 매개변수를 사용합니다: 🎜
  • 🎜old 문자열에서 바꾸려는 하위 문자열 🎜
  • 🎜new old🎜
  • 🎜count count의 첫 번째 항목만 바꾸기(선택 사항) 🎜
  • ul >
    🎜참고 이 방법은 원래 문자열을 변경하지 않습니다. 문자열은 Python에서 불변입니다. 🎜
    🎜여기 또 다른 예가 있습니다. 🎜rrreee🎜공백 문자로 문자열을 분할하기 전에 구두점을 제거하기 위해 str.replace() 메서드를 사용합니다. 🎜
    🎜지정된 문자를 제거하고 싶기 때문에 교체를 위해 빈 문자열을 사용합니다. 🎜
    🎜필요한 만큼 str.replace() 메서드 호출을 연결할 수 있습니다. 🎜🎜마지막 단계는 str.split() 메서드를 사용하여 문자열을 단어 목록으로 분할하는 것입니다. 🎜🎜str.split() 메서드는 구분 기호를 사용하여 문자열을 하위 문자열 목록으로 분할합니다. 🎜🎜이 방법은 다음 2개의 매개변수를 사용합니다. 🎜
    • 🎜구분 기호는 구분 기호가 나타날 때마다 문자열을 하위 문자로 분할합니다. 문자열 🎜
    • 🎜maxsplit maxsplit 분할 완료(선택 사항) 🎜
    🎜 str.split( ) 메서드에 구분 기호가 전달되지 않은 경우 , 입력 문자열을 하나 이상의 공백 문자로 분할합니다. 🎜rrreee🎜문자열에서 구분 기호를 찾을 수 없으면 요소가 1개만 포함된 목록을 반환합니다. 🎜

    재사용 가능한 함수를 사용하여 여러 구분 기호를 기반으로 문자열을 분할합니다.

    🎜여러 구분 기호를 기반으로 문자열을 자주 분할해야 하는 경우 재사용 가능한 함수를 정의하세요. 🎜rrreee🎜split_multiple 함수는 문자열과 구분 기호 목록을 허용하고 구분 기호를 기준으로 문자열을 분할합니다. 🎜🎜str.join() 메서드는 | 파이프와 구분 기호를 결합하는 데 사용됩니다. 분할기. 🎜rrreee🎜이렇게 하면 지정된 구분 기호를 기준으로 문자열을 분할하는 데 사용할 수 있는 정규식 패턴이 생성됩니다. 🎜🎜문자열을 여러 구분 기호가 있는 단어 목록으로 분할해야 하는 경우 re.findall() 메서드를 사용할 수도 있습니다. 🎜

    re.findall()을 사용하여 문자열을 단어 목록으로 분할

    🎜re.findall() 메서드를 사용하여 문자열을 여러 구분 기호 목록이 있는 단어로 분할합니다. 🎜🎜re.findall() 메서드는 단어가 나타날 때마다 문자열을 분할하고 해당 단어가 포함된 목록을 반환합니다. 🎜rrreee🎜re.findall 메서드는 패턴과 문자열을 인수로 사용하고 문자열에서 패턴이 겹치지 않는 모든 항목을 포함하는 문자열 목록을 반환합니다. 🎜

    我们传递给 re.findall() 方法的第一个参数是一个正则表达式。

    import re
    
    my_str = 'fql jiyik, dot # com. abc'
    
    my_list = re.findall(r'[\w]+', my_str)
    print(my_list)  # ????️ ['fql', 'jiyik', 'dot', 'com', 'abc']

    方括号 [] 用于表示一组字符。

    \w 字符与 Unicode 单词字符匹配,并且包括可以作为任何语言的单词一部分的大多数字符。

    加号 + 使正则表达式匹配前面字符(Unicode 字符)的 1 次或多次重复。

    re.findall() 方法返回一个包含字符串中单词的列表。

위 내용은 Python에서 여러 구분 기호가 포함된 문자열을 어떻게 분할합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 yisu.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제