>  기사  >  Java  >  Java8의 새로운 기능인 람다의 역할을 해석합니다.

Java8의 새로운 기능인 람다의 역할을 해석합니다.

零下一度
零下一度원래의
2017-06-17 14:11:471346검색

우리는 람다가 Java에 클로저 개념을 도입하기를 오랫동안 기다려왔지만 이를 컬렉션에 사용하지 않으면 많은 가치를 잃게 됩니다. 기존 인터페이스를 람다 스타일로 마이그레이션하는 문제는 기본 방법을 통해 해결되었습니다. 이 기사에서는 Java 컬렉션의 배치 데이터 작업을 심층적으로 분석하고 람다의 가장 강력한 효과에 대한 미스터리를 풀 것입니다.

우리는 람다가 Java에 클로저 개념을 도입하기를 오랫동안 기다려왔지만 컬렉션에서 사용하지 않으면 많은 가치를 잃습니다. 기존 인터페이스를 람다 스타일로 마이그레이션하는 문제는 기본 메서드를 통해 해결되었습니다. 이 기사에서는 Java 컬렉션의 대량 데이터 작업(대량 작업)을 심층적으로 분석하고 람다의 가장 강력한 역할에 대한 미스터리를 풀어보겠습니다.

1. JSR335에 대하여

JSR은 Java Spec Requests의 약자로 Java 사양 요청을 의미합니다. Java 8 버전의 주요 개선 사항은 Java를 만드는 것을 목표로 하는 Lambda 프로젝트(JSR 335)입니다. 멀티 코어의 경우 프로세서가 코드를 작성합니다.

2. 외부 VS 내부 반복

과거 Java 컬렉션은 내부 반복을 표현할 수 없었고 for 또는 while 루프인 외부 반복 방법만 제공했습니다.


List persons = asList(new Person("Joe"), new Person("Jim"), new Person("John"));
for (Person p : persons) {
 p.setLastName("Doe");
}

위의 예는 소위 외부 반복이라는 이전 접근 방식입니다. 루프는 고정 시퀀스 루프입니다. 오늘날의 멀티 코어 시대에 병렬 루프를 실행하려면 위의 코드를 수정해야 합니다. 효율성이 얼마나 향상될 수 있는지는 아직 불확실하며 특정 위험(스레드 안전 문제 등)이 발생할 수 있습니다.

내부 반복을 설명하려면 Lambda와 같은 클래스 라이브러리를 사용해야 합니다. 람다와 Collection을 사용하겠습니다.forEach위 루프를 다시 작성합니다.


persons.forEach(p->p.setLastName("Doe"));

이제 jdk 라이브러리가 루프를 제어합니다. 각 개인 객체에 성이 어떻게 설정되는지 걱정할 필요가 없습니다. 라이브러리는 실행 환경, 병렬, 비순차 또는 지연 로딩에 따라 이를 수행하는 방법을 결정할 수 있습니다. 이는 내부 반복이며 클라이언트는 p.setLastName 동작을 데이터로 API에 전달합니다. 실제로 내부 반복은 컬렉션의 배치 작업과 밀접한 관련이 없습니다. 이를 통해 문법 표현의 변화를 느낄 수 있습니다. 일괄 작업과 관련하여 정말 흥미로운 점은 새로운 스트림 API입니다. 새로운 java.util.stream 패키지가 JDK 8에 추가되었습니다.

3. 스트림 API

스트림은 데이터 스트림만 나타내며 데이터 구조가 없으므로 한 번 순회한 후에는 더 이상 순회할 수 없습니다. (이 점은 컬렉션과 달리 프로그래밍 시 주의해야 합니다. 아무리 많이 탐색하더라도 그 안에 여전히 데이터가 있습니다. 소스는 컬렉션, 배열, IO 등이 될 수 있습니다.

3.1 중간 및 종료 방법

플로우 기능은 빅데이터 운영을 위한 인터페이스를 제공하여 데이터 운영을 보다 쉽고 빠르게 만드는 것입니다. 필터링, 매핑, 순회 횟수 감소 등의 메서드가 있습니다. 이러한 메서드는 중간 메서드와 터미널 메서드의 두 가지 유형으로 구분됩니다. 중간 메서드는 기본적으로 항상 Stream을 반환해야 합니다. 최종 결과를 얻고 싶습니다. 그렇다면 엔드포인트 작업을 사용하여 스트림에서 생성된 최종 결과를 수집해야 합니다. 이 두 메서드의 차이점은 반환 값을 살펴보는 것입니다. Stream이면 중간 메서드이고, 그렇지 않으면 end 메서드입니다.

여러 중간 방법(filter, map)과 끝점 방법(collect, sum)에 대한 간략한 소개

3.1.1Filter

데이터 스트림에서 필터링 기능을 구현하는 것은 우리가 할 수 있는 가장 자연스러운 작업입니다. 먼저 생각해 보세요. Stream 인터페이스는 필터 조건을 정의하는 람다 식 을 사용하는 작업을 나타내는 Predicate 구현을 허용할 수 있는 필터 메서드를 노출합니다.


List persons = …
Stream personsOver18 = persons.stream().filter(p -> p.getAge() > 18);//过滤18岁以上的人

3.1.2Map

객체 변환 등의 일부 데이터를 지금 필터링한다고 가정해 보겠습니다. Map 연산을 통해 입력 매개변수를 받아들이고 이를 반환하는 함수 구현(Function43ca9160a1fbc6e1e17f36fac17e2094의 일반 T 및 R은 각각 실행 입력 및 실행 결과를 나타냄)을 실행할 수 있습니다. 먼저 익명 내부 클래스 형식으로 이를 설명하는 방법을 살펴보겠습니다.


Stream adult= persons
    .stream()
    .filter(p -> p.getAge() > 18)
    .map(new Function() {
     @Override
     public Adult apply(Person person) {
      return new Adult(person);//将大于18岁的人转为成年人
     }
    });

이제 위의 예를 람다 식으로 변환합니다.



Stream map = persons.stream()
     .filter(p -> p.getAge() > 18)
     .map(person -> new Adult(person));

3.1.3Count

The count 메소드는 스트림 결과의 최종 통계를 만들고 int를 반환할 수 있는 스트림의 끝점 메소드입니다. 예를 들어 18세


int countOfAdult=persons.stream()
      .filter(p -> p.getAge() > 18)
      .map(person -> new Adult(person))
      .count();

3.1.4Collect

collect 메소드도 마찬가지입니다. 최종 결과를 수집하는 스트림의 엔드포인트 메소드



List adultList= persons.stream()
      .filter(p -> p.getAge() > 18)
      .map(person -> new Adult(person))
      .collect(Collectors.toList());

또는 특정 구현 클래스를 사용하여 결과를 수집하려는 경우:



List adultList = persons
     .stream()
     .filter(p -> p.getAge() > 18)
     .map(person -> new Adult(person))
     .collect(Collectors.toCollection(ArrayList::new));

篇幅有限,其他的中间方法和终点方法就不一一介绍了,看了上面几个例子,大家明白这两种方法的区别即可,后面可根据需求来决定使用。

3.2顺序流与并行流

每个Stream都有两种模式:顺序执行和并行执行。

顺序流:


List <Person> people = list.getStream.collect(Collectors.toList());

并行流:


List <Person> people = list.getStream.parallel().collect(Collectors.toList());

顾名思义,当使用顺序方式去遍历时,每个item读完后再读下一个item。而使用并行去遍历时,数组会被分成多个段,其中每一个都在不同的线程中处理,然后将结果一起输出。

3.2.1并行流原理:


List originalList = someData;
split1 = originalList(0, mid);//将数据分小部分
split2 = originalList(mid,end);
new Runnable(split1.process());//小部分执行操作
new Runnable(split2.process());
List revisedList = split1 + split2;//将结果合并

大家对hadoop有稍微了解就知道,里面的 MapReduce  本身就是用于并行处理大数据集的软件框架,其 处理大数据的核心思想就是大而化小,分配到不同机器去运行map,最终通过reduce将所有机器的结果结合起来得到一个最终结果,与MapReduce不同,Stream则是利用多核技术可将大数据通过多核并行处理,而MapReduce则可以分布式的。

3.2.2顺序与并行性能测试对比

如果是多核机器,理论上并行流则会比顺序流快上一倍,下面是测试代码


long t0 = System.nanoTime();

  //初始化一个范围100万整数流,求能被2整除的数字,toArray()是终点方法

  int a[]=IntStream.range(0, 1_000_000).filter(p -> p % 2==0).toArray();

  long t1 = System.nanoTime();

  //和上面功能一样,这里是用并行流来计算

  int b[]=IntStream.range(0, 1_000_000).parallel().filter(p -> p % 2==0).toArray();

  long t2 = System.nanoTime();

  //我本机的结果是serial: 0.06s, parallel 0.02s,证明并行流确实比顺序流快

  System.out.printf("serial: %.2fs, parallel %.2fs%n", (t1 - t0) * 1e-9, (t2 - t1) * 1e-9);

3.3关于Folk/Join框架

应用硬件的并行性在java 7就有了,那就是 java.util.concurrent 包的新增功能之一是一个 fork-join 风格的并行分解框架,同样也很强大高效,有兴趣的同学去研究,这里不详谈了,相比Stream.parallel()这种方式,我更倾向于后者。

4.总结

如果没有lambda,Stream用起来相当别扭,他会产生大量的匿名内部类,比如上面的3.1.2map例子,如果没有default method,集合框架更改势必会引起大量的改动,所以lambda+default method使得jdk库更加强大,以及灵活,Stream以及集合框架的改进便是最好的证明。

위 내용은 Java8의 새로운 기능인 람다의 역할을 해석합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.