집 >백엔드 개발 >파이썬 튜토리얼 >Python을 사용하여 문자열을 단어로 어떻게 분할합니까?

Python을 사용하여 문자열을 단어로 어떻게 분할합니까?

DDD원래의: 2024-11-09 20:48:021036검색

How do I split a string into words using Python?

Python의 문자열 분할

Python에서는 str.split() 메서드를 사용하여 구분 기호에 따라 문자열을 분할할 수 있습니다. 또는 단어 분할을 위한 정규식. 기본적으로 str.split()은 공백 문자(공백, 탭 및 줄 바꿈 포함)에 따라 문자열을 분할합니다.

기본 구분 기호 사용

다음 코드는 기본 구분 기호를 사용하여 문자열을 단어 목록으로 분할하는 방법을 보여줍니다.

text = "many   fancy word \nhello    \thi"
words = text.split()

print(words)
# 输出：['many', 'fancy', 'word', 'hello', 'hi']

예를 들어 문자열 텍스트는 ['many', 'fancy', 'word', 'hello', 'hi'] 단어 목록으로 분할됩니다.

정규식 구분 기호 사용

정규식을 구분 기호로 지정할 수도 있습니다. 이를 통해 더 복잡한 패턴을 기반으로 문자열을 토큰화할 수 있습니다.

다음 코드는 정규식을 사용하여 문자열을 단어 목록으로 분할하는 방법을 보여줍니다. 여기서 공백 문자나 여러 연속 공백은 구분 기호로 간주됩니다.

import re

text = "many   fancy word \nhello    \thi"
white_space_regex = r"\s+"
words = re.split(white_space_regex, text)

print(words)
# 输出：['many', 'fancy', 'word', 'hello', 'hi']

여기서 정규식 r"s"는 하나 이상의 공백 문자와 일치하므로 문자열을 단어 목록으로 분할합니다. 각 단어 사이에는 적어도 하나의 공백 문자가 있습니다.

Notes

str.split()는 튜플이 아닌 문자열 목록을 반환합니다.
문자열에 구분 기호가 없으면 str.split()는 원래 문자열을 포함하는 단일 요소 목록을 반환합니다.
str.split() 메소드의 두 번째 매개변수로 최대 분할 수를 지정할 수 있습니다.

위 내용은 Python을 사용하여 문자열을 단어로 어떻게 분할합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

Python 正则表达式 String 字符串 using word

성명：

이전 기사：Python에서 목록의 문자열 표현을 실제 목록 개체로 변환하는 방법은 무엇입니까?다음 기사：Python에서 목록의 문자열 표현을 실제 목록 개체로 변환하는 방법은 무엇입니까?