ホームページ >バックエンド開発 >Python チュートリアル >Pythonで単語の頻度をカウントし、頻度で並べ替える方法は?
単語の頻度のカウントと頻度による並べ替え
テキスト データを含む大規模なデータセットを操作する場合、多くの場合、個々の単語の頻度を分析する必要があります。 。この情報は、さまざまな自然言語処理 (NLP) タスクに使用できます。 Python では、Counter と呼ばれる強力なツールを使用してこのタスクを簡素化できます。
設計の実装
設計の概要は次の手順です:
Python でのカウンターの使用
Python のコレクション モジュールは、特殊なCounter と呼ばれるクラス。反復可能な要素をカウントして集計するために設計されています。 Counter を使用すると、ステップ 3 ~ 6 を 1 行のコードで実行できます。 Counter を使用してデザインを実装する方法は次のとおりです。
<code class="python">from collections import Counter # Create a Counter from the list of words counts = Counter(original_list) # Sort the keys (unique words) based on their frequencies sorted_words = sorted(counts.keys(), key=lambda x: counts[x], reverse=True)</code>
このコードは、最も頻度の高い単語が最初に表示される、一意の単語の並べ替えリストを生成します。
例
<code class="python">list1 = ['the', 'car', 'apple', 'banana', 'car', 'apple'] counts = Counter(list1) print(counts) # Counter({'apple': 2, 'car': 2, 'banana': 1, 'the': 1}) sorted_words = sorted(counts.keys(), key=lambda x: counts[x], reverse=True) print(sorted_words) # ['apple', 'car', 'banana', 'the']</code>
以上がPythonで単語の頻度をカウントし、頻度で並べ替える方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。