ホームページ  >  記事  >  バックエンド開発  >  単語の出現頻度を取得するPythonプログラム

単語の出現頻度を取得するPythonプログラム

王林
王林転載
2023-09-08 18:29:021776ブラウズ

単語の出現頻度を取得するPythonプログラム

この記事では、Python で単語の出現頻度をパーセンテージとして取得する方法を学びます。

文字列入力リストを取得したとします。ここで、指定された入力文字列リスト内の各単語の割合を見つけます。

###式### リーリー

使用説明書

    sum()、Counter()、join()、split() 関数を使用する
  • join()、split()、count() 関数を使用する
  • 演算子モジュールの countOf() 関数を使用します。
  • 方法 1: sum()、Counter()、join()、split() 関数を使用する

join()

は、文字列区切り文字で区切られたシーケンス要素を結合して文字列を形成するために使用される Python の文字列関数です。

Counter()

この関数は、ハッシュ可能なオブジェクトの数をカウントするサブクラスです。呼び出されたり呼び出されたりすると、反復可能なオブジェクトのハッシュ テーブルが暗黙的に作成されます。 アルゴリズム (ステップ)

以下は、必要なタスクを実行するためのアルゴリズム/手順です:

    import キーワードを使用して、コレクション モジュールから Counter 関数をインポートします。
  • 入力リスト
  • 文字列を格納する変数を作成し、リストを出力します。

  • join()
  • 関数を使用して、入力リストのすべての文字列要素を結合します。

  • split()
  • 関数 (文字列をリストに分割します。区切り文字は定義できます。デフォルトの区切り文字は任意の空白文字です) を使用して、連結された文字列を単語のリストに分割します。

    Counter() 関数は単語の出現頻度をキーと値のペアとして取得します

  • values()
  • 関数を使用して Counter からすべての値 (頻度/カウント) を取得し、sum() 関数を使用してその合計を取得します (すべての値の合計を返します)。反復可能なプロジェクト)。

  • items()
  • 関数を使用して、上記の反対語に含まれる各単語の割合を取得します (ビュー オブジェクトを返します。つまり、辞書のキーと値のペアがタプルとして含まれています)リストにあります)。

    入力リスト内の各単語の割合を出力します。
  • Example
  • の中国語訳は次のとおりです:
Example

次のプログラムは、sum()、Counter()、join()、split() 関数を使用して、入力文字列の指定されたリスト内の各単語の割合を返します –

リーリー ###出力###

上記のプログラムを実行すると、次の出力が生成されます -

リーリー

方法 2: join()、split()、および count() 関数を使用する

アルゴリズム (ステップ)

以下は、必要なタスクを実行するためのアルゴリズム/手順です:

結果のパーセンテージ/用語頻度を保存する空の辞書を作成します。

  • for ループ

    を使用して単語リストを走査します。
  • if 条件文

    を使用して、現在の要素がディクショナリのキーに含まれていないことを確認します。
  • keys()
  • 関数を使用します。

    上記の条件が true の場合、count() 関数を使用してキー (単語) の数を取得します。

  • これを単語の数で割って現在の単語の頻度を取得し、上で作成した新しい辞書にキーとして保存します。

  • 入力リスト内の各単語の割合を出力します。

  • Example

    の中国語訳は次のとおりです:

    Example
次のプログラムは、join()、split()、および count() 関数を使用して、入力文字列の指定されたリスト内の各単語の割合を返します –

リーリー ###出力###

上記のプログラムを実行すると、次の出力が生成されます -

リーリー

方法 3: オペレーター モジュールの countOf() 関数を使用する

Example

の中国語訳は次のとおりです:

Example

次のプログラムは、countOf() 関数を使用して、入力文字列の指定されたリスト内の各単語の割合を返します -

リーリー ###出力###

上記のプログラムを実行すると、次の出力が生成されます -

リーリー ###結論は###

この記事では、単語頻度のパーセントを計算するための 3 つの異なる Python メソッドを学習しました。また、演算子モジュールの新しい関数 countOf() を使用してリスト要素の頻度を取得する方法も学びました。

以上が単語の出現頻度を取得するPythonプログラムの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はtutorialspoint.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。