>  기사  >  백엔드 개발  >  Python을 사용하여 문자열을 단어로 어떻게 분할합니까?

Python을 사용하여 문자열을 단어로 어떻게 분할합니까?

DDD
DDD원래의
2024-11-09 20:48:02883검색

How do I split a string into words using Python?

Python의 문자열 분할

Python에서는 str.split() 메서드를 사용하여 구분 기호에 따라 문자열을 분할할 수 있습니다. 또는 단어 분할을 위한 정규식. 기본적으로 str.split()은 공백 문자(공백, 탭 및 줄 바꿈 포함)에 따라 문자열을 분할합니다.

기본 구분 기호 사용

다음 코드는 기본 구분 기호를 사용하여 문자열을 단어 목록으로 분할하는 방법을 보여줍니다.

text = "many   fancy word \nhello    \thi"
words = text.split()

print(words)
# 输出:['many', 'fancy', 'word', 'hello', 'hi']

예를 들어 문자열 텍스트는 ['many', 'fancy', 'word', 'hello', 'hi'] 단어 목록으로 분할됩니다.

정규식 구분 기호 사용

정규식을 구분 기호로 지정할 수도 있습니다. 이를 통해 더 복잡한 패턴을 기반으로 문자열을 토큰화할 수 있습니다.

다음 코드는 정규식을 사용하여 문자열을 단어 목록으로 분할하는 방법을 보여줍니다. 여기서 공백 문자나 여러 연속 공백은 구분 기호로 간주됩니다.

import re

text = "many   fancy word \nhello    \thi"
white_space_regex = r"\s+"
words = re.split(white_space_regex, text)

print(words)
# 输出:['many', 'fancy', 'word', 'hello', 'hi']

여기서 정규식 r"s"는 하나 이상의 공백 문자와 일치하므로 문자열을 단어 목록으로 분할합니다. 각 단어 사이에는 적어도 하나의 공백 문자가 있습니다.

Notes

  • str.split()는 튜플이 아닌 문자열 목록을 반환합니다.
  • 문자열에 구분 기호가 없으면 str.split()는 원래 문자열을 포함하는 단일 요소 목록을 반환합니다.
  • str.split() 메소드의 두 번째 매개변수로 최대 분할 수를 지정할 수 있습니다.

위 내용은 Python을 사용하여 문자열을 단어로 어떻게 분할합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.