Python의 문자열 분할
Python에서는 str.split() 메서드를 사용하여 구분 기호에 따라 문자열을 분할할 수 있습니다. 또는 단어 분할을 위한 정규식. 기본적으로 str.split()은 공백 문자(공백, 탭 및 줄 바꿈 포함)에 따라 문자열을 분할합니다.
기본 구분 기호 사용
다음 코드는 기본 구분 기호를 사용하여 문자열을 단어 목록으로 분할하는 방법을 보여줍니다.
text = "many fancy word \nhello \thi" words = text.split() print(words) # 输出:['many', 'fancy', 'word', 'hello', 'hi']
예를 들어 문자열 텍스트는 ['many', 'fancy', 'word', 'hello', 'hi'] 단어 목록으로 분할됩니다.
정규식 구분 기호 사용
정규식을 구분 기호로 지정할 수도 있습니다. 이를 통해 더 복잡한 패턴을 기반으로 문자열을 토큰화할 수 있습니다.
다음 코드는 정규식을 사용하여 문자열을 단어 목록으로 분할하는 방법을 보여줍니다. 여기서 공백 문자나 여러 연속 공백은 구분 기호로 간주됩니다.
import re text = "many fancy word \nhello \thi" white_space_regex = r"\s+" words = re.split(white_space_regex, text) print(words) # 输出:['many', 'fancy', 'word', 'hello', 'hi']
여기서 정규식 r"s"는 하나 이상의 공백 문자와 일치하므로 문자열을 단어 목록으로 분할합니다. 각 단어 사이에는 적어도 하나의 공백 문자가 있습니다.
Notes
위 내용은 Python을 사용하여 문자열을 단어로 어떻게 분할합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!