首頁  >  文章  >  Java  >  如何使用串流計算 Java 8 中的詞頻?

如何使用串流計算 Java 8 中的詞頻?

Barbara Streisand
Barbara Streisand原創
2024-10-31 05:54:30422瀏覽

How to Count Word Frequencies in Java 8 Using Streams?

使用流在 Java 8 中進行詞頻計數

計算清單中單字的頻率是文字處理中的一項常見任務。在 Java 8 中,可以使用 Collectors.groupingBy() 和 Collectors.counting() 方法來有效地實現這一點。

要尋找字串清單中的詞頻,可以使用下列步驟:

  1. 在清單上呼叫 stream() 以建立流。
  2. 使用 Collectors.groupingBy(Function.identity()) 將流中的元素依值分組。
  3. 使用 Collectors.counting() 計算每個單字的出現次數。

例如,給定以下單字清單:

List<String> wordsList = Lists.newArrayList("hello", "bye", "ciao", "bye", "ciao");

您可以計算單字頻率為如下:

Map<String,Long> wordFrequencies = wordsList.stream()
    .collect(Collectors.groupingBy(Function.identity(), Collectors.counting()));

這將產生一個包含單字頻率的地圖,其中鍵是單詞,數值是出現的次數。給定清單的結果將是:

{ciao=2, hello=1, bye=2}

要按值對映射進行排序,您可以使用 LinkedHashMap 和 entrySet() 方法將映射條目收集到流中。然後,使用sorted()按值降序對條目進行排序,並使用Collectors.toMap()將它們收集到新的LinkedHashMap中:

LinkedHashMap<String, Long> countByWordSorted = wordFrequencies.entrySet()
    .stream()
    .sorted(Map.Entry.comparingByValue(Comparator.reverseOrder()))
    .collect(Collectors.toMap(
        Map.Entry::getKey,
        Map.Entry::getValue,
        (v1, v2) -> { throw new IllegalStateException(); },
        LinkedHashMap::new
    ));

這將產生一個排序映射,其中單字按以下順序排序他們的頻率。

以上是如何使用串流計算 Java 8 中的詞頻?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn