>  기사  >  백엔드 개발  >  Python 프로그램: 문자열에 있는 모든 단어의 시작 및 끝 인덱스 찾기

Python 프로그램: 문자열에 있는 모든 단어의 시작 및 끝 인덱스 찾기

WBOY
WBOY앞으로
2023-08-28 09:17:061266검색

Python 프로그램: 문자열에 있는 모든 단어의 시작 및 끝 인덱스 찾기

때로는 단어의 시작 색인과 해당 단어의 마지막 색인이 필요할 때가 있습니다. 문장은 공백으로 구분된 단어로 구성됩니다. 이 Python 기사에서는 문장이나 주어진 문자열에 있는 모든 단어의 시작 및 끝 인덱스를 찾는 두 가지 다른 방법이 두 가지 다른 예를 사용하여 제공됩니다. 첫 번째 예에서는 단어의 시작을 표시하는 공백을 찾는 동안 문자열의 모든 문자를 단순히 반복하는 프로세스를 따릅니다. 예제 2에서는 Natural Language Toolkit을 사용하여 문자열에 있는 모든 단어의 시작 및 끝 인덱스를 찾습니다.

예제 1 - 반복을 통해 문자열에 있는 모든 단어의 시작 및 끝 인덱스를 찾습니다.

알고리즘

1단계 - 먼저 문자열을 가져와 주어진 Str로 이름을 지정합니다.

2단계 - 주어진 Str을 가져와 반복하고, 공백을 확인하고, 모든 단어의 시작 및 끝 인덱스가 포함된 튜플 목록을 반환하는 StartandEndIndex라는 함수를 만듭니다.

3단계 - 분할 방법을 사용하여 단어 목록을 만듭니다.

4단계 - 위의 두 목록에서 값을 가져와 사전을 만듭니다.

5단계 - 프로그램을 실행하고 결과를 확인합니다.

Python 파일에는 다음이 포함되어 있습니다

으아아아

결과 보기 - 예 1

결과를 보려면 cmd 창에서 Python 파일을 실행하세요.

으아아아

그림 1: 명령 창에 표시된 결과.

예제 2: nltk(Natural Language Toolkit)를 사용하여 문자열에 있는 모든 단어의 시작 및 끝 인덱스를 찾습니다.

알고리즘

1단계 - 먼저 pip 명령을 사용하여 nltk를 설치합니다. 이제 align_tokens를 가져옵니다.

2단계 - 주어진 Str을 테스트 문자열로 취하고 분할 함수를 사용하여 단어로 분할한 후 listofwords라고 부릅니다.

3단계 - 이제 주어진 Str과 함께 align_tokens 및 listofwords를 토큰으로 사용합니다.

4단계 - 공백이 포함된 단어 인덱스 목록을 반환합니다. 공백이 없는 단어 인덱스 목록을 얻으려면 마지막 단어 인덱스 값에서 1을 뺍니다.

5단계 - 위의 두 목록에서 값을 가져와 사전을 만듭니다.

6단계 - 프로그램을 실행하고 결과를 확인합니다.

Python 파일에는 다음이 포함되어 있습니다

으아아아

결과 보기 - 예 2

cmd 창을 열고 Python 파일을 실행하여 결과를 확인하세요.

으아아아

그림 2: 단어와 해당 색인 표시.

이 Python 기사에서는 두 가지 다른 예를 사용하여 문자열에 있는 모든 단어의 시작 및 끝 인덱스를 찾는 방법을 제공합니다. 예제 1에서는 문자열의 모든 문자를 반복하여 이를 수행합니다. 여기서는 새로운 단어의 시작을 표시하기 위해 공백이 선택되었습니다. 예제 2에서는 nltk 라이브러리 또는 Natural Language Toolkit이 사용됩니다. 먼저 pip를 사용하여 설치합니다. 그런 다음 align_tokens라는 필수 모듈을 가져옵니다. 이 모듈을 사용하고 단어 목록에 태그를 지정하면 모든 단어의 색인을 찾을 수 있습니다.

위 내용은 Python 프로그램: 문자열에 있는 모든 단어의 시작 및 끝 인덱스 찾기의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 tutorialspoint.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제