Web 開発とデータ分析では、単語の頻度を理解することが重要です。これを達成するために、Java 8 を使用してリスト内の単語の頻度をカウントする方法を詳しく説明します。
Java 8 の Stream API は、Word 用の洗練されたソリューションを提供します。周波数のカウント。まず、単語のリストを作成します:
List<String> wordsList = Lists.newArrayList("hello", "bye", "ciao", "bye", "ciao");
コア ロジックには、単語をその ID ごとにグループ化し、出現回数をカウントすることが含まれます:
Map<String, Long> collect = wordsList.stream() .collect(Collectors.groupingBy(Function.identity(), Collectors.counting()));
これにより、各キーが含まれるマップが生成されます。固有の単語であり、対応する値はその頻度です。出力は次のようになります。
{ciao=2, hello=1, bye=2}
整数値のカウント
long 値の代わりに整数値が必要な場合は、
Map<String, Integer> collect = wordsList.stream() .collect(Collectors.groupingBy(Function.identity(), Collectors.summingInt(e -> 1)));
値に基づいてマップを降順に並べ替えるには、次を使用します。
LinkedHashMap<String, Long> countByWordSorted = collect.entrySet() .stream() .sorted(Map.Entry.comparingByValue(Comparator.reverseOrder())) .collect(Collectors.toMap( Map.Entry::getKey, Map.Entry::getValue, (v1, v2) -> { throw new IllegalStateException(); }, LinkedHashMap::new ));
このステップでは、キーが単語を表し、値が表す並べ替えられた LinkedHashMap が返されます。ソートされた周波数。
以上がJava 8 を使用してリスト内の単語の頻度を効率的にカウントするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。