ホームページ >バックエンド開発 >Python チュートリアル >Python を使用して文字列内の単語の長さを計算する

Python を使用して文字列内の単語の長さを計算する

PHPz
PHPz転載
2023-09-13 11:29:031312ブラウズ

Python を使用して文字列内の単語の長さを計算する

Python を使用して特定の入力文字列内の個々の単語の長さを検出することは、解決する必要がある問題です。テキスト入力内の各単語の文字数をカウントし、結果をリストなどの構造化されたスタイルで表示したいと考えています。このタスクでは、入力文字列を分割し、各単語を分離する必要があります。次に、単語内の文字数に基づいて各単語の長さを計算します。基本的な目標は、入力を効率的に受け取り、語長を決定し、結果をタイムリーに出力できる関数またはプロシージャを作成することです。この問題に対処することは、テキスト処理、自然言語処理、データ分析などのさまざまなアプリケーションにおいて重要です。これらのアプリケーションでは、語長の統計によって洞察力のある情報が提供され、追加の分析が可能になります。

使用説明書

  • ループとsplit()関数を使用する

  • map() 関数を len および Split() とともに使用する

  • re モジュールで re.split() メソッドを使用する

  • 辞書を使用して単語の長さを保存する

ループとsplit()関数の使用

基本的かつ単純な Python テキスト処理および分析手法は、ループと Split() 関数を使用して単語の長さを取得することです。この手法を使用して入力文字列を構成単語に分解すると、単語のリストを繰り返し確認することで各単語の長さを判断できます。このメソッドでは、split() 関数は基本的にスペース文字に基づいて入力テキストをトークン化し、単語を互いに分離するため、重要です。結果として得られる単語リストは、残りの単語長計算の基礎として機能します。この手法は、テキスト入力から重要な情報を理解し、抽出するのに効果的かつ簡単であるため、テキスト分析ツールセットの重要な部分です。

###アルゴリズム###

    入力文字列をパラメータとして受け取る関数 findWordLengths を定義します。
  • split() 関数を使用して、スペースを区切り文字として使用して、入力文字列を個々の単語に分割します。結果を単語というリストに保存します。
  • 空のリスト「wordLengths」を初期化して、単語の長さを格納します。
  • 単語リスト内の単語ごとに、次の操作を実行します。
  • a. len() 関数を使用して、現在の単語の長さを計算します。
  • b. 現在の単語の長さを「wordLengths」リストに追加します。

    「wordLengths」リストを返します。
  • ###例### リーリー ###出力### リーリー
  • map() 関数を len および Split() とともに使用する

Python で単語の長さを決定する方法は、map() 関数と len および Split() を組み合わせて、テキスト データの操作の問題に対する洗練された効率的な答えを提供します。このアプローチでは、Python の組み込み関数の能力を活用しており、これらの関数を組み合わせることで、入力文字列内の個々の単語の長さを迅速に決定できます。 Split() メソッドはスペースを区切り文字として使用し、入力文字列を効果的に個別の単語に分割します。これがこの戦略の基礎です。その結果、さらなる調査の基礎となる用語のリストが作成されました。 map() メソッドを使用して、各単語に len() 関数を適用することで、このリストをすべての単語の長さを含む反復可能なリストに変更します。

###アルゴリズム###

入力文字列をパラメータとして受け取る関数 findWordLengths を定義します。このパラメータには入力文字列が含まれます。

split() 関数を使用して、スペースを区切り文字として使用して、入力文字列を個々の単語に分割します。結果を単語というリストに保存します。

  • len() 関数は主に長さを計算するため、map() 関数を使用して単語リスト内の各単語に len() 関数を適用します。これにより、単一の単語の長さを含む反復が生成されます。

  • map() から取得した反復可能オブジェクトをリストに変換して、1 つの単語の長さを取得します。

  • 語長のリストを返します。

  • ###例### リーリー ###出力### リーリー

    re モジュールで re.split() メソッドを使用します

  • 正規表現は、テキストの変更とパターン マッチングに効果的なツールです。 re.split() 関数は、空白文字を単語の区切り文字としてインテリジェントに検出することにより、この場合にフレーズを単語にタグ付けするための信頼できる手法として機能します。単語を正確に分割するには、正規表現パターン r ' が 1 つ以上の連続する空白文字と一致します。この方法は、さまざまな入力テキスト形式を処理する場合に非常にうまく機能し、さまざまな空白パターンを許可し、正確な語長の計算を提供します。正規表現を使用すると、大量の入力データを処理する場合でも効率的になります。さらに、他のライブラリがないため、実装が簡素化されます。
  • ###アルゴリズム###

  • その単語を含む文を入力してください。

re.split() メソッドと正規表現 r'\s ' を使用して、文を単語に分割します。

単語の長さを格納するために空のリストを初期化します。

    単語リスト内の各単語を反復処理します。
  • a.現在の単語の長さを計算します。
  • b.語長を語長リストに追加します。
  • 出力語長リスト。

示例

import re

def word_lengths(sentence):
   
   words = re.split(r'\s+', sentence)
   
   word_lengths = []
   
   for word in words:
      length = len(word)
      word_lengths.append(length)
   
   return word_lengths

sentence = "This is a sample sentence"
result = word_lengths(sentence)
print(result)

输出

[4, 2, 1, 6, 8]

使用字典存储单词长度

使用字典保存单词长度来确定字符串中单词长度的方法将 Python 内置数据结构的有效性与简单的算法相结合,以提供有效且适应性强的结果。该技术通过使用 len() 函数迭代计算字典中每个单词的长度,为字典中的每个单词生成键值对。给出单词的长度作为匹配值,并将单词设置为键。由于这个清晰简单的过程,字长的收集是精确和有效的。

生成的词典提供每个单词对应的单词长度,捕获文本的广泛视图。为了进一步处理或分析数据,这种格式可以轻松检索字长。

算法

  • 输入包含单词的句子。

  • 使用 split() 方法将句子拆分为单词,这将为我们的输入字符串创建单词列表。

  • 初始化一个空字典来存储单词长度。

  • 迭代单词列表中的每个单词,如下所示:

  • a。计算当前单词的长度。

  • b。向字典中添加一个条目,以单词为键,以单词长度为值。

  • 输出包含单词长度的字典。

示例

def word_lengths(sentence):

   words = sentence.split()
   word_lengths_dict = {}
   
   for word in words:
      length = len(word)
      word_lengths_dict[word] = length
   
   return word_lengths_dict

sentence = "This is how the length of words is calculated"
result = word_lengths(sentence)
print(result)

输出

{'This': 4, 'is': 2, 'how': 3, 'the': 3, 'length': 6, 'of': 2, 'words': 5, 'is': 2, 'calculated': 10}

结论

总而言之,我们研究了四种不同的 Python 方法来计算字符串中的单词长度。对于简单的工作,前两种方法(使用循环和 split() 函数或带有 len 和 split() 的 map() 函数)提供了简单性和有效性。第三个选项利用 re 模块中的 re.split() 方法,展示了正则表达式的强大功能,适合在复杂的文本处理应用程序中使用。最后但并非最不重要的一点是,使用字典来跟踪单词长度提供了一种系统且实用的方法来检索和处理单词数据。每种方法都具有特定的优点,使程序员能够根据特定需求和编码偏好选择最佳选项。

以上がPython を使用して文字列内の単語の長さを計算するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はtutorialspoint.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。