Java 8 Stream 的終極技巧——Collectors 功能與操作方法詳解

本文例項講述了Java 8 Stream 的終極技巧——Collectors 功能與操作方法。分享給大家供大家參考，具體如下：

1. 前言

昨天在 Collection移除元素操作相關的文章中提到了 Collectors 。相信很多同學對這個比較感興趣，那我們今天就來研究一下 Collectors 。

2. Collectors 的作用

Collectors 是 Java 8 加入的操作類，位於 java.util.stream 包下。它會根據不同的策略將元素收集歸納起來，比如最簡單常用的是將元素裝入Map、Set、List 等可變容器中。特別對於 Java 8 Stream Api 來說非常有用。它提供了collect()

方法來對 Stream 流進行終結操作派生出基於各種策略的結果集。我們就藉助於 Stream 來熟悉一下 Collectors 吧。我們依然用昨天的例子：

  List<String> servers = new ArrayList<>();
    servers.add("Felordcn");
    servers.add("Tomcat");
    servers.add("Jetty");
    servers.add("Undertow");
    servers.add("Resin");

3. Java 8 中 Collectors 的方法

Collectors 提供了一系列的靜態方法供我們使用，通常情況我們靜態匯入即可使用。接下來我們來看看都提供了哪些方法吧。

3.1 型別歸納

這是一個系列，作用是將元素分別歸納進可變容器 List、Map、Set、Collection 或者ConcurrentMap 。

  Collectors.toList();
  Collectors.toMap();
  Collectors.toSet();
  Collectors.toCollection();
  Collectors.toConcurrentMap();

我們可以根據以上提供的 API 使用 Stream 的 collect

方法中的轉換為熟悉的集合容器。非常簡單這裡不再演示。

3.2 joining

將元素以某種規則連線起來。該方法有三種過載 joining(CharSequence delimiter) 和 joining(CharSequence delimiter,CharSequence prefix,CharSequence suffix)

 //  輸出 FelordcnTomcatJettyUndertowResin
 servers.stream().collect(Collectors.joining());

 //  輸出 Felordcn,Tomcat,Jetty,Undertow,Resin
 servers.stream().collect(Collectors.joining("," ));

 //  輸出 [Felordcn,Resin]
 servers.stream().collect(Collectors.joining(",","[","]"));

用的比較多的是讀取 HttpServletRequest 中的 body ：

 HttpServletRequest.getReader().lines().collect(Collectors.joining());

3.3 collectingAndThen

該方法先執行了一個歸納操作，然後再對歸納的結果進行 Function 函式處理輸出一個新的結果。

 // 比如我們將servers joining 然後轉成大寫，結果為： FELORDCN,TOMCAT,JETTY,UNDERTOW,RESIN  
 servers.stream.collect(Collectors.collectingAndThen(Collectors.joining(","),String::toUpperCase));

3.4 groupingBy

按照條件對元素進行分組，和 SQL 中的 group by 用法有異曲同工之妙，通常也建議使用 Java 進行分組處理以減輕資料庫壓力。groupingBy 也有三個過載方法
我們將 servers 按照長度進行分組:

// 按照字串長度進行分組  符合條件的元素將組成一個 List 對映到以條件長度為key 的 Map<Integer,List<String>> 中
servers.stream.collect(Collectors.groupingBy(String::length))

如果我不想 Map 的 value 為 List 怎麼辦？上面的實現實際上呼叫了下面的方式：

 //Map<Integer,Set<String>>
 servers.stream.collect(Collectors.groupingBy(String::length,Collectors.toSet()))

我要考慮同步安全問題怎麼辦？當然使用執行緒安全的同步容器啊，那前兩種都用不成了吧！別急！我們來推斷一下，其實第二種等同於下面的寫法:

 Supplier<Map<Integer,Set<String>>> mapSupplier = HashMap::new;
 Map<Integer,Set<String>> collect = servers.stream.collect(Collectors.groupingBy(String::length,mapSupplier,Collectors.toSet()));

這就非常好辦了，我們提供一個同步 Map 不就行了，於是問題解決了：

 Supplier<Map<Integer,Set<String>>> mapSupplier = () -> Collections.synchronizedMap(new HashMap<>());
 Map<Integer,Collectors.toSet()));

其實同步安全問題 Collectors 的另一個方法 groupingByConcurrent 給我們提供瞭解決方案。用法和 groupingBy 差不多。

3.5 partitioningBy

partitioningBy 我們在本文開頭的提到的文章中已經見識過了，可以看作 groupingBy 的一個特例，基於斷言（Predicate）策略分組。這裡不再舉例說明。

3.6 counting

該方法歸納元素的的數量，非常簡單，不再舉例說明。

3.7 maxBy/minBy

這兩個方法分別提供了查詢大小元素的操作，它們基於比較器介面 Comparator 來比較，返回的是一個 Optional 物件。我們來獲取 servers 中最小長度的元素:

 // Jetty 
Optional<String> min = servers.stream.collect(Collectors.minBy(Comparator.comparingInt(String::length)));

這裡其實 Resin 長度也是最小，這裡遵循了 "先入為主" 的原則。當然 Stream.min() 可以很方便的獲取最小長度的元素。maxBy 同樣的道理。

3.8 summingInt/Double/Long

用來做累加計算。計算元素某個屬性的總和,類似 Mysql 的 sum 函式，比如計算各個專案的盈利總和、計算本月的全部工資總和等等。我們這裡就計算一下 servers 中字串的長度之和（為了舉例不考慮其它寫法）。

 // 總長度 32 
 servers.stream.collect(Collectors.summingInt(s -> s.length()));

3.9 summarizingInt/Double/Long

如果我們對 3.6章節-3.8章節 的操作結果都要怎麼辦？難不成我們搞5個 Stream 流嗎？所以就有了 summarizingInt、summarizingDouble、summarizingLong 三個方法。
這三個方法通過對元素某個屬性的提取，會返回對元素該屬性的統計資料物件，分別對應 IntSummaryStatistics、DoubleSummaryStatistics、LongSummaryStatistics。我們對 servers 中元素的長度進行統計：

 DoubleSummaryStatistics doubleSummaryStatistics = servers.stream.collect(Collectors.summarizingDouble(String::length));
 // {count=5,sum=32.000000,min=5.000000,average=6.400000,max=8.000000}
 System.out.println("doubleSummaryStatistics.toString() = " + doubleSummaryStatistics.toString());

結果 DoubleSummaryStatistics 中包含了 總數，總和，最小值，最大值，平均值 五個指標。

3.10 mapping

該方法是先對元素使用 Function 進行再加工操作，然後用另一個Collector 歸納。比如我們先去掉 servers 中元素的首字母，然後將它們裝入 List 。

 // [elordcn,omcat,etty,ndertow,esin]
 servers.stream.collect(Collectors.mapping(s -> s.substring(1),Collectors.toList()));

有點類似 Stream 先進行了 map 操作再進行 collect ：

 servers.stream.map(s -> s.substring(1)).collect(Collectors.toList());

3.11 reducing

這個方法非常有用！但是如果要了解這個就必須瞭解其引數 BinaryOperator<T> 。這是一個函式式介面，是給兩個相同型別的量，返回一個跟這兩個量相同型別的一個結果，偽表示式為 (T,T) -> T。預設給了兩個實現 maxBy 和 minBy ，根據比較器來比較大小並分別返回最大值或者最小值。當然你可以靈活定製。然後 reducing 就很好理解了，元素兩兩之間進行比較根據策略淘汰一個，隨著輪次的進行元素個數就是 reduce 的。那這個有什麼用處呢？ Java 官方給了一個例子：統計每個城市個子最高的人。

 Comparator<Person> byHeight = Comparator.comparing(Person::getHeight);
   Map<String,Optional<Person>> tallestByCity = people.stream()
             .collect(Collectors.groupingBy(Person::getCity,Collectors.reducing(BinaryOperator.maxBy(byHeight))));

結合最開始給的例子你可以使用 reducing 找出最長的字串試試。

上面這一層是根據 Height 屬性找最高的 Person ，而且如果這個屬性沒有初始化值或者沒有資料，很有可能拿不到結果所以給出的是 Optional<Person>。如果我們給出了 identity 作一個基準值，那麼我們首先會跟這個基準值進行 BinaryOperator 操作。
比如我們給出高於 2 米的人作為 identity。我們就可以統計每個城市不低於 2 米而且最高的那個人，當然如果該城市沒有人高於 2 米則返回基準值identity ：

 Comparator<Person> byHeight = Comparator.comparing(Person::getHeight);
 Person identity= new Person();
      identity.setHeight(2.);
      identity.setName("identity");
   Map<String,Person> collect = persons.stream()
            .collect(Collectors.groupingBy(Person::getCity,Collectors.reducing(identity,BinaryOperator.maxBy(byHeight))));

這時候就確定一定會返回一個 Person 了，最起碼會是基準值identity 不再是 Optional 。

還有些情況，我們想在 reducing 的時候把 Person 的身高先四捨五入一下。這就需要我們做一個對映處理。定義一個 Function<? super T,? extends U> mapper 來幹這個活。那麼上面的邏輯就可以變更為：

  Comparator<Person> byHeight = Comparator.comparing(Person::getHeight);
    Person identity = new Person();
    identity.setHeight(2.);
    identity.setName("identity");
    // 定義對映 處理 四捨五入
    Function<Person,Person> mapper = ps -> {
      Double height = ps.getHeight();

      BigDecimal decimal = new BigDecimal(height);
      Double d = decimal.setScale(1,BigDecimal.ROUND_HALF_UP).doubleValue();
      ps.setHeight(d);
      return ps;
    };
    Map<String,Person> collect = persons.stream()
        .collect(Collectors.groupingBy(Person::getCity,mapper,BinaryOperator.maxBy(byHeight))));

4. 總結

今天我們對 Java 8 中的 Collectors 進行了詳細的講解。如果你熟悉了 Collectors 操作 Stream 會更加得心應手。當然在 Java 8 之後的 Java 9 和 Java 12 中 Collectors 都有新增的功能，後面有時間我們會繼續進行講解。敬請關注！

更多關於java演算法相關內容感興趣的讀者可檢視本站專題：《Java檔案與目錄操作技巧彙總》、《Java資料結構與演算法教程》、《Java操作DOM節點技巧總結》和《Java快取操作技巧彙總》

希望本文所述對大家java程式設計有所幫助。

Java 8 Stream 的終極技巧——Collectors 功能與操作方法詳解

1. 前言

2. Collectors 的作用

3. Java 8 中 Collectors 的方法

3.1 型別歸納

3.2 joining

3.3 collectingAndThen

3.4 groupingBy

3.5 partitioningBy

3.6 counting

3.7 maxBy/minBy

3.8 summingInt/Double/Long

3.9 summarizingInt/Double/Long

3.10 mapping

3.11 reducing

4. 總結

Java 8 Stream 的終極技巧——Collectors 功能與操作方法詳解

php libevent 功能與使用方法詳解

Java二叉搜尋樹基礎原理與實現方法詳解

Java集合功能與用法例項詳解

Java 8 Stream.distinct() 列表去重的操作

Python中sys模組功能與用法例項詳解

python 裝飾器功能與用法案例詳解

Java連結串列中新增元素的原理與實現方法詳解

JS陣列Reduce方法功能與用法例項詳解

《手把手教你》系列技巧篇（四十八）-java+ selenium自動化測試-判斷元素是否可操作（詳解教程）

Java使用I/O流讀取檔案內容的方法詳解

mysql儲存過程原理與使用方法詳解

MySQL使用者許可權驗證與管理方法詳解

python雙向連結串列原理與實現方法詳解

Python中順序表原理與實現方法詳解

Mysql賬戶管理原理與實現方法詳解

PHP高階程式設計之訊息佇列原理與實現方法詳解

Python通過TensorFLow進行線性模型訓練原理與實現方法詳解

Python雙鏈表原理與實現方法詳解

Python單鏈表原理與實現方法詳解

Java 8 Stream 的終極技巧——Collectors 功能與操作方法詳解

1. 前言

2. Collectors 的作用

3. Java 8 中 Collectors 的方法

3.1 型別歸納

3.2 joining

3.3 collectingAndThen

3.4 groupingBy

3.5 partitioningBy

3.6 counting

3.7 maxBy/minBy

3.8 summingInt/Double/Long

3.9 summarizingInt/Double/Long

3.10 mapping

3.11 reducing

4. 總結

相關推薦