ホームページ  >  記事  >  バックエンド開発  >  Python プログラム: 文字列内のすべての単語の開始インデックスと終了インデックスを検索します。

Python プログラム: 文字列内のすべての単語の開始インデックスと終了インデックスを検索します。

WBOY
WBOY転載
2023-08-28 09:17:061263ブラウズ

Python プログラム: 文字列内のすべての単語の開始インデックスと終了インデックスを検索します。

単語の開始インデックスとその単語の最後のインデックスが必要になる場合があります。文はスペースで区切られた単語で構成されます。この Python 記事では、文または特定の文字列内のすべての単語の開始インデックスと終了インデックスを見つける 2 つの異なる方法が、2 つの異なる例を使用して示されています。最初の例では、単語の先頭をマークするスペースを探しながら、文字列のすべての文字を単純に反復処理するプロセスに従います。例 2 では、Natural Language Toolkit を使用して、文字列内のすべての単語の開始インデックスと終了インデックスを検索します。

例 1 - 文字列を反復処理して、文字列内のすべての単語の開始インデックスと終了インデックスを見つけます。

###アルゴリズム###

ステップ 1

- まず文字列を取得し、指定された Str という名前を付けます。

ステップ 2

- StartandEndIndex という関数を作成します。この関数は、指定された Str を取得して反復処理し、空白をチェックして、すべての単語の開始インデックスと終了インデックスを含むタプルのリストを返します。

ステップ 3

- 分割方法を使用して単語リストを作成します。

ステップ 4

- 上記 2 つのリストの値を使用して、辞書を作成します。

ステップ 5

- プログラムを実行して結果を確認します。 Python ファイルにはこのコンテンツが含まれています

リーリー

結果の表示 - 例 1

結果を確認するには、cmd ウィンドウで Python ファイルを実行します。

リーリー

図 1: コマンド ウィンドウに結果を表示。

例 2: nltk (自然言語ツールキット) を使用して、文字列内のすべての単語の開始インデックスと終了インデックスを検索します。

###アルゴリズム###

ステップ 1

- まず、pip コマンドを使用して nltk をインストールします。ここで、そこから align_tokens をインポートします。

ステップ 2 - 指定された Str をテスト文字列として取得し、split 関数を使用して単語に分割し、それを listofwords と呼びます。

ステップ 3 - ここで、指定された Str とともに align_tokens と listofwords をトークンとして使用します。

ステップ 4 - 単語のインデックス リストが返されますが、スペースが含まれます。最後の単語インデックス値から 1 を減算すると、スペースのない単語インデックス リストが得られます。

ステップ 5 - 上記 2 つのリストの値を使用して、辞書を作成します。

ステップ 6 - プログラムを実行して結果を確認します。

Python ファイルにはこのコンテンツが含まれています リーリー 結果の表示 - 例 2

cmd ウィンドウを開き、Python ファイルを実行して結果を表示します。

リーリー

図 2: 単語とそのインデックスの表示。

この Python 記事では、2 つの異なる例を使用して、文字列内のすべての単語の開始インデックスと終了インデックスを見つける方法を示します。例 1 では、これは文字列のすべての文字を反復処理することによって実現されます。ここでは、新しい単語の始まりを示すためにスペースが選択されています。例 2 では、nltk ライブラリまたは Natural Language Toolkit が使用されます。まず、pipを使用してインストールします。次に、align_tokens という名前の必要なモジュールをインポートします。このモジュールを使用し、単語リストでタグを指定すると、すべての単語のインデックスを見つけることができます。

以上がPython プログラム: 文字列内のすべての単語の開始インデックスと終了インデックスを検索します。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はtutorialspoint.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。