首頁  >  文章  >  Java  >  解讀Java8新特性--lambda的作用

解讀Java8新特性--lambda的作用

零下一度
零下一度原創
2017-06-17 14:11:471355瀏覽

我們期待了很久lambda為java帶來閉包的概念,但是如果我們不在集合中使用它的話,就損失了很大價值。現有介面遷移成為lambda風格的問題已經透過default methods解決了,在這篇文章將深入解析Java集合裡面的批量資料操作解開lambda最強作用的神秘面紗。

我們期待了很久lambda為java帶來閉包的概念,但如果我們不在集合中使用它的話,就損失了很大價值。現有介面遷移成為lambda風格的問題已經透過default methods解決了,在這篇文章將深入解析Java集合裡面的批量資料操作(bulk operation),解開lambda最強作用的神秘面紗。

1.關於JSR335

#JSR是Java Specification Requests的縮寫,意思是Java 規格請求,Java 8 版本的主要改進是Lambda 專案(JSR 335),目的是讓Java 更容易為多核心處理器編寫程式碼。

2.外部VS內部迭代

#以前Java集合是不能夠表達內部迭代的,而只提供了一種外在迭代的方式,也就是for或while迴圈


List persons = asList(new Person("Joe"), new Person("Jim"), new Person("John"));
for (Person p : persons) {
 p.setLastName("Doe");
}

上面的例子是我們先前的做法,也就是所謂的外部迭代,循環是固定的順序循環。在現在多核心的時代,如果我們想並行循環,不得不修改以上程式碼。效率能有多大提升也說定,且會帶來一定的風險(線程安全問題等等)。

要描述內部迭代,我們需要用到Lambda這樣的類別庫,下面利用lambda和Collection.forEach重寫上面的循環 


#
persons.forEach(p->p.setLastName("Doe"));

現在是由jdk 函式庫來控制循環了,我們不需要關心last name是怎麼被設定到每一個person物件裡面去的,函式庫可以根據運行環境來決定怎麼做,並行,亂序或懶加載方式。這就是內部迭代,客戶端將行為p.setLastName當做資料傳入api裡面。 內部迭代其實和集合的批次操作並沒有密切的聯繫,借助它我們感受到語法表達上的變化。真正有意思的和批量操作相關的是新的流(stream)API。新的java.util.stream套件已經加入JDK 8了。

3.Stream API

#串流(Stream)只代表資料流,並沒有資料結構,所以他遍歷完一次之後便再也無法遍歷(這點在程式設計時候需要注意,不像Collection,遍歷多少次裡面都還有數據),它的來源可以是Collection、array、io等等。

3.1中間與終點方法

#流作用是提供了一個操作大數據接口,讓資料操作更容易和更快。它具有過濾、映射以及減少遍歷數等方法,這些方法分為兩種:中間方法和終端方法,「流」抽像天生就該是持續的,中間方法永遠返回的是Stream,因此如果我們要獲取最終結果的話,必須使用終點操作才能收集流產生的最終結果。區分這兩個方法是看他的回傳值,如果是Stream則是中間方法,否則是終點方法。

簡單介紹下幾個中間方法(filter、map)以及終點方法(collect、sum)

##3.1.1Filter

在資料流中實現過濾功能是首先我們可以想到的最自然的操作了。 Stream介面揭露了一個filter方法,它可以接受表示操作的Predicate實作來使用定義了過濾條件的lambda

表達式


List persons = …
Stream personsOver18 = persons.stream().filter(p -> p.getAge() > 18);//过滤18岁以上的人

3.1.2Map

#假使我們現在過濾了一些數據,例如轉換物件的時候。 Map操作允許我們執行一個Function的實作(Function43ca9160a1fbc6e1e17f36fac17e2094的泛型T,R分別表示執行輸入和執行結果),它接受入參並回傳。首先,讓我們來看看怎麼以匿名內部類別的方式來描述它:


Stream adult= persons
    .stream()
    .filter(p -> p.getAge() > 18)
    .map(new Function() {
     @Override
     public Adult apply(Person person) {
      return new Adult(person);//将大于18岁的人转为成年人
     }
    });

現在,把上述範例轉換成使用lambda表達式的寫法:



Stream map = persons.stream()
     .filter(p -> p.getAge() > 18)
     .map(person -> new Adult(person));

3.1.3Count

#count方法是一個流的終點方法,可使流的結果最終統計,返回int,例如我們計算一下滿足18歲的總數


int countOfAdult=persons.stream()
      .filter(p -> p.getAge() > 18)
      .map(person -> new Adult(person))
      .count();

3.1.4Collect

collect方法也是一個流的終點方法,可收集最終的結果



List adultList= persons.stream()
      .filter(p -> p.getAge() > 18)
      .map(person -> new Adult(person))
      .collect(Collectors.toList());

或者,如果我們想使用特定的實作類別來收集結果:



List adultList = persons
     .stream()
     .filter(p -> p.getAge() > 18)
     .map(person -> new Adult(person))
     .collect(Collectors.toCollection(ArrayList::new));

篇幅有限,其他的中间方法和终点方法就不一一介绍了,看了上面几个例子,大家明白这两种方法的区别即可,后面可根据需求来决定使用。

3.2顺序流与并行流

每个Stream都有两种模式:顺序执行和并行执行。

顺序流:


List <Person> people = list.getStream.collect(Collectors.toList());

并行流:


List <Person> people = list.getStream.parallel().collect(Collectors.toList());

顾名思义,当使用顺序方式去遍历时,每个item读完后再读下一个item。而使用并行去遍历时,数组会被分成多个段,其中每一个都在不同的线程中处理,然后将结果一起输出。

3.2.1并行流原理:


List originalList = someData;
split1 = originalList(0, mid);//将数据分小部分
split2 = originalList(mid,end);
new Runnable(split1.process());//小部分执行操作
new Runnable(split2.process());
List revisedList = split1 + split2;//将结果合并

大家对hadoop有稍微了解就知道,里面的 MapReduce  本身就是用于并行处理大数据集的软件框架,其 处理大数据的核心思想就是大而化小,分配到不同机器去运行map,最终通过reduce将所有机器的结果结合起来得到一个最终结果,与MapReduce不同,Stream则是利用多核技术可将大数据通过多核并行处理,而MapReduce则可以分布式的。

3.2.2顺序与并行性能测试对比

如果是多核机器,理论上并行流则会比顺序流快上一倍,下面是测试代码


long t0 = System.nanoTime();

  //初始化一个范围100万整数流,求能被2整除的数字,toArray()是终点方法

  int a[]=IntStream.range(0, 1_000_000).filter(p -> p % 2==0).toArray();

  long t1 = System.nanoTime();

  //和上面功能一样,这里是用并行流来计算

  int b[]=IntStream.range(0, 1_000_000).parallel().filter(p -> p % 2==0).toArray();

  long t2 = System.nanoTime();

  //我本机的结果是serial: 0.06s, parallel 0.02s,证明并行流确实比顺序流快

  System.out.printf("serial: %.2fs, parallel %.2fs%n", (t1 - t0) * 1e-9, (t2 - t1) * 1e-9);

3.3关于Folk/Join框架

应用硬件的并行性在java 7就有了,那就是 java.util.concurrent 包的新增功能之一是一个 fork-join 风格的并行分解框架,同样也很强大高效,有兴趣的同学去研究,这里不详谈了,相比Stream.parallel()这种方式,我更倾向于后者。

4.总结

如果没有lambda,Stream用起来相当别扭,他会产生大量的匿名内部类,比如上面的3.1.2map例子,如果没有default method,集合框架更改势必会引起大量的改动,所以lambda+default method使得jdk库更加强大,以及灵活,Stream以及集合框架的改进便是最好的证明。

以上是解讀Java8新特性--lambda的作用的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn