>  기사  >  백엔드 개발  >  문자열을 여러 하위 문자열로 분할하는 Python 프로그램

문자열을 여러 하위 문자열로 분할하는 Python 프로그램

WBOY
WBOY앞으로
2023-09-04 19:17:061501검색

문자열을 여러 하위 문자열로 분할하는 Python 프로그램

Python에서는 split() 메서드를 사용하여 문자열을 하위 문자열로 나눌 수 있습니다. Split() 메서드는 지정된 구분 기호를 기반으로 문자열을 하위 문자열 목록으로 분할하는 내장 Python 문자열 메서드 중 하나입니다. 이 기사에서는 예제를 통해 문자열을 하위 문자열로 분할하는 방법을 알아봅니다.

문자열을 하위 문자열로 분할

방법 1: Split() 방법을 사용하세요

split() 메서드는 Python에 내장된 문자열 메서드로, 지정된 구분 기호를 기준으로 문자열을 하위 문자열 목록으로 분할합니다. 구분 기호는 하위 문자열을 구분하는 모든 문자 또는 문자열일 수 있습니다. Split() 메서드는 구분 기호라는 하나의 매개 변수를 사용합니다. 구분 기호를 지정하지 않으면 문자열이 개별 문자로 분할됩니다.

예: 공백 및 쉼표 구분 기호를 기준으로 분할

아래 예에서는 공백 구분 기호를 사용하여 문자열을 분할합니다. Split() 메소드를 사용하고 공백 구분 기호를 전달하여 공백을 기준으로 문자열을 분할합니다.

으아아아

출력

으아아아

예: 정규식을 사용하여 분할

아래 예에서는 정규식 모듈의 분할() 함수를 사용하여 대시 및 공백 구분 기호를 사용하여 문자열 "23-456-7890"을 세 개의 하위 문자열로 분할합니다.

으아아아

출력

으아아아

방법 2: 목록 이해 사용

List Comprehension은 Python에서 목록을 만드는 간결한 방법입니다. 기존 목록이나 기타 반복 가능한 객체를 기반으로 새 목록을 생성하는 동시에 반복 가능한 요소에 대해 필터를 적용하고 변환을 수행할 수도 있습니다.

문법

으아아아

여기서 "expression"은 iterable의 각 요소에 대해 수행될 변환 또는 작업이고, "item"은 현재 처리 중인 요소이고, "iterable"은 요소의 소스이며, "condition"은 다음을 결정하는 선택적 필터입니다. 결과 목록에 요소가 포함되는지 여부에 대한 특정 조건.

아래 예에서는 공백으로 구분된 일련의 단어가 포함된 "sentence"라는 문자열로 시작합니다. 우리는 분할() 메소드를 사용하여 문자열을 단어 목록으로 분할한 다음 목록 이해를 사용하여 원래 문자열의 각 단어를 포함하는 "단어"라는 새 목록을 만듭니다.

으아아아

출력

으아아아

방법 3: partition() 방법 사용

partition() 메서드는 Python에 내장된 문자열 메서드로, 지정된 구분 기호를 기준으로 문자열을 세 부분으로 나눕니다. 구분 기호 앞 문자열의 왼쪽 부분, 구분 기호 자체, 구분 기호 뒤 문자열의 오른쪽 부분을 포함하는 튜플을 반환합니다. 문자열에서 구분 기호를 찾을 수 없는 경우 메서드는 원래 문자열과 두 개의 빈 문자열이 포함된 튜플을 반환합니다.

문법

으아아아

여기서 string은 분할하려는 문자열이고 delimiter는 파티션 기능이 문자열을 분할하는 데 사용할 구분 기호입니다.

아래 예에서는 partition() 메서드를 사용하여 "Hello World!" 문자열을 공백 구분 기호를 기준으로 세 부분으로 나눕니다. 결과 튜플에는 왼쪽 부분 "Hello", 구분 기호 "", 오른쪽 부분 "World!"가 포함됩니다.

으아아아

출력

으아아아

방법 4: 분할선() 함수 사용

splitlines() 메서드는 Python에 내장된 문자열 메서드로, 개행 문자 "n"을 기준으로 문자열을 줄 목록으로 분할합니다. 문자열에 개행 문자가 포함되어 있지 않으면 원래 문자열을 유일한 요소로 포함하는 목록을 반환합니다.

문법

으아아아

여기서 Splitlines()는 매개변수를 사용하지 않으며 항상 줄바꿈을 기준으로 문자열을 분할합니다.

아래 예에서는 분할선() 메서드를 사용하여 "Line 1nLine 2nLine 3" 문자열을 행 목록으로 분할합니다. 결과 목록에는 원래 문자열의 각 줄에 하나씩 세 개의 요소가 포함됩니다.

으아아아

출력

으아아아

방법 5: re.findall() 방법을 사용하세요

re.findall() 메서드는 문자열에서 지정된 정규식 패턴의 모든 항목을 검색하고 모든 일치 항목의 목록을 반환하는 Python의 re 모듈에 있는 함수입니다. 정규식 패턴에는 다양한 유형의 문자 또는 시퀀스를 나타내는 다양한 문자가 포함될 수 있으므로 복잡한 패턴 일치 및 문자열의 특정 부분 추출이 가능합니다.

문법

으아아아

여기서 re.findall() 메서드는 정규식을 사용하여 문자열에서 일치하는 단어를 찾습니다. 이는 findall() 함수에도 전달됩니다.

아래 예에서는 re.findall() 메서드를 사용하여 문자열에서 정규식 패턴 bw{5}b가 나타나는 모든 항목을 검색합니다. 이 패턴은 단어 경계(즉, 단어의 시작 또는 끝)로 둘러싸인 5개의 단어 문자(문자, 숫자 또는 밑줄) 시퀀스와 일치합니다. re.findall() 메서드는 문자열에서 찾은 모든 일치 항목의 목록을 반환합니다.

import re

string = "The quick brown fox jumps over the lazy dog"
matches = re.findall(r"\b\w{5}\b", string)
print(matches)

输出

['quick', 'brown', 'jumps']

结论

在本文中,我们讨论了如何在 Python 中使用 split() 函数、使用列表理解、使用分区方法、使用 splitline 方法以及使用 re.findall() 将字符串拆分为多个子字符串方法。 split() 函数采用分隔符作为参数。然后根据该分隔符分割字符串。 splitline 方法始终根据新行分隔符分割字符串。我们可以使用本文中介绍的任何方法,具体取决于我们想要执行的拆分类型。

위 내용은 문자열을 여러 하위 문자열로 분할하는 Python 프로그램의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 tutorialspoint.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제