ホームページ  >  記事  >  Java  >  Java 8 を使用してリスト内の単語の頻度を効率的にカウントするにはどうすればよいですか?

Java 8 を使用してリスト内の単語の頻度を効率的にカウントするにはどうすればよいですか?

Patricia Arquette
Patricia Arquetteオリジナル
2024-10-31 20:41:02594ブラウズ

How can I efficiently count word frequency in a list using Java 8?

Java 8 を使用した単語の頻度のカウント

Web 開発とデータ分析では、単語の頻度を理解することが重要です。これを達成するために、Java 8 を使用してリスト内の単語の頻度をカウントする方法を詳しく説明します。

Java 8 ソリューション

Java 8 の Stream API は、Word 用の洗練されたソリューションを提供します。周波数のカウント。まず、単語のリストを作成します:

List<String> wordsList = Lists.newArrayList("hello", "bye", "ciao", "bye", "ciao");

コア ロジックには、単語をその ID ごとにグループ化し、出現回数をカウントすることが含まれます:

Map<String, Long> collect = wordsList.stream()
    .collect(Collectors.groupingBy(Function.identity(), Collectors.counting()));

これにより、各キーが含まれるマップが生成されます。固有の単語であり、対応する値はその頻度です。出力は次のようになります。

{ciao=2, hello=1, bye=2}

整数値のカウント

long 値の代わりに整数値が必要な場合は、

Map<String, Integer> collect = wordsList.stream()
     .collect(Collectors.groupingBy(Function.identity(), Collectors.summingInt(e -> 1)));

を使用します。値によるマップの並べ替え

値に基づいてマップを降順に並べ替えるには、次を使用します。

LinkedHashMap<String, Long> countByWordSorted = collect.entrySet()
            .stream()
            .sorted(Map.Entry.comparingByValue(Comparator.reverseOrder()))
            .collect(Collectors.toMap(
                    Map.Entry::getKey,
                    Map.Entry::getValue,
                    (v1, v2) -> {
                        throw new IllegalStateException();
                    },
                    LinkedHashMap::new
            ));

このステップでは、キーが単語を表し、値が表す並べ替えられた LinkedHashMap が返されます。ソートされた周波数。

以上がJava 8 を使用してリスト内の単語の頻度を効率的にカウントするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。