Stream の中間操作とは、フィルター フィルタリング、マップ マッピング変換、フラットマップのマージ、個別の重複排除、並べ替えなどを含む、ストリーム チェーン内のデータの処理操作を指します。操作する。これらの操作は新しい Stream オブジェクトを返します。このオブジェクトは、複数の中間操作を連鎖させることで複雑なデータ処理を実行できます。中間操作には、トリガーされる終了操作が必要であることに注意してください。
ストリームの一般的な中間操作をカテゴリ別に説明します。
filter() メソッドは、データ フィルター処理を実装するためによく使用されます。コレクションや配列などのデータ ソース、および新しいストリームを返します。
ブラックリストに登録された携帯電話番号のリストがあり、「133」で始まるすべての要素をフィルターで除外する必要があるとします。その後、filter() -
//将数组转换为一个字符串列表 List<String> numbers = Arrays.asList("13378520000","13278520000","13178520000","13358520000"); //通过stream()方法创建一个流,接着使用filter()方法过滤出前缀为“133”的元素,最终通过collect() 方法将结果收集到一个新列表中 List<String> filterdNumbers = numbers.stream().filter(s -> s.startsWith("133")).collect(Collectors.toList()); System.out.println(filterdNumbers); //打印结果:[13378520000, 13358520000]
map() メソッドは、ストリーム内の各要素をマップし、別の要素に変換するか、要素内の情報を抽出して、新しいストリームを返すために使用されます。
次の 2 つのケースに応じて、要素を別の要素に変換し、要素内の情報を抽出するための map() を学習します -
1.2.1. 要素の変換
携帯電話番号文字のリストがあり、最初の 7 桁に基づいて携帯電話番号の位置を特定する必要があると仮定し、すべての携帯電話番号の最初の 7 つの部分文字列を取得する必要があります。
List<String> numbers = Arrays.asList("13378520000","13278520000","13178520000","13558520000"); //通过stream()方法创建一个流,使用map()方法将每个字符串转换为截取前7位的字符,最后使用collect()方法将结果收集到一个新列表中 List<String> filterdNumbers = numbers.stream().map(s -> s.substring(0,7)).collect(Collectors.toList()); System.out.println(filterdNumbers); //打印结果:[1337852, 1327852, 1317852, 1355852]
1.2.2. 要素情報の抽出
ユーザー オブジェクトのリストがあると仮定します。各オブジェクトの携帯電話番号を抽出する必要があります。これは、map() メソッドを使用して実現できます:
List<People> peopleList = Arrays.asList( new People("王二","13378520000"), new People("李二","13278520000"), new People("张四","13178520000") ); //通过stream()方法创建一个流,使用map()方法提取每个用户的手机号,最后使用collect()方法将结果收集到一个新列表中 List<String> tel = peopleList.stream().map(People::getTel).collect(Collectors.toList()); System.out.println(tel); //打印结果:[13378520000, 13278520000, 13178520000]
flatMap() メソッド多対多のマッピングを実装したり、複数のリストを 1 つのリスト操作にマージしたりできます。
1.3.1. 多対多マッピングの実装
バランス リスト A と B の 2 セットがあり、グループ A の各要素は次のことを行う必要があると仮定します。要素は順番に追加され、 flatMap を使用して多対多のマッピングを実装できます -
List<Integer> listA = Arrays.asList(1, 2, 3); List<Integer> listB = Arrays.asList(4, 5, 6); List<Integer> list = listA.stream().flatMap(a -> listB.stream().map(b -> a +b)).collect(Collectors.toList()); System.out.println(list); //打印结果: [5, 6, 7, 6, 7, 8, 7, 8, 9]
1.3.2. 複数のリストを 1 つのリストに結合する
複数の携帯電話番号文字列リストを含むリストがあるとします。次に、すべての携帯電話番号文字列をリストにマージする必要があります。これを実現するには、 flatMap() メソッドを使用します。
List<List<String>> listOfLists = Arrays.asList( Arrays.asList("13378520000", "13278520000"), Arrays.asList("13178520000", "13558520000"), Arrays.asList("15138510000", "15228310000") ); List<String> flatMapList = listOfLists.stream().flatMap(Collection::stream).collect(Collectors.toList()); System.out.println(flatMapList); //打印结果:[13378520000, 13278520000, 13178520000, 13558520000, 15138510000, 15228310000]
distinct() メソッドを使用すると、ストリーム内の重複要素を削除し、重複のないリストを生成できます。
繰り返される携帯電話番号文字列を含むリストがあると仮定すると、distinct() を使用して操作の重複を排除できます -
List<String> numbers = Arrays.asList("13378520000", "15138510000","13178520000", "15138510000"); List<String> disNumbers = numbers.stream().distinct().collect(Collectors.toList()); System.out.println(disNumbers); //打印结果:[13378520000, 15138510000, 13178520000]
フローの重複排除には、distinct が使用されることに注意してください。ストリーム内の要素が、equals() メソッドと hashCode() メソッドを実装していることを確認してください。これら 2 つのメソッドは、2 つのオブジェクトが等しいかどうかを判断するための標準であるためです。
sorted() メソッドは、ストリーム内の要素を並べ替えるために使用されます。
People オブジェクトのグループを年齢で並べ替える必要があるとします。以下はそれぞれ昇順と降順で並べ替えられます -
デフォルトでは、昇順で並べ替えられます——
List<People> peopleList = Arrays.asList( new People("王二",20), new People("李二",30), new People("张四",31) ); List<People> newpeopleList=peopleList.stream().sorted(Comparator.comparing(People::getAge)).collect(Collectors.toList()); //打印结果 newpeopleList.stream().forEach(System.out::println);印刷結果:
People{name='王二', age=20}
People {name='Li Er', age=30}People{ name='Zhang Si', age=31}
逆順に並べ替えるには reversed() メソッドを使用します。つまり、逆順に昇順に並べ替えます——
1.5.2、降順
List<People> peopleList = Arrays.asList( new People("王二",20), new People("李二",30), new People("张四",31) ); List<People> newpeopleList = peopleList.stream().sorted(Comparator.comparing(People::getAge).reversed()).collect(Collectors.toList()); //打印结果 newpeopleList.stream().forEach(System.out::println);印刷結果:
People{name=' Zhang Si', age=31}
People{ name='Li Er', age=30}People{name='Wang Er', age=20}
#1.6 、peek: 各要素の情報を表示しますが、変更はしませんストリーム内の要素のステータス
peek() メソッドは、ストリーム内の要素のステータスを変更せずにストリーム内の要素を表示するために使用されます。どの段階でも使用できますが、フローには影響しません。操作を終了することも、フロー操作を終了することもありません。List<String> telList = Arrays.asList("13378520000","13278520000","13178520000","13558520000"); telList.stream().peek(t -> System.out.println(t)) .map(t -> t.substring(0,3)) .peek(t -> System.out.println(t)) .collect(Collectors.toList());印刷結果: 非常に似ており、どちらもストリーム内の要素を走査するために使用できますが、この 2 つには大きな違いがあります。重要な点は、forEach はストリーム内の終了操作であるということです。これが呼び出されると、ストリームが処理され、それ以上の操作は実行できなくなります。たとえば、マップやフィルターなどの操作はストリームに対して実行できません。 forEach の後ですが、ピーク メソッドは OK です。上記の例からわかるように、初めて Peak を呼び出して要素を出力した後、要素の後にマップ操作を実行して文字列の最初の 3 桁をインターセプトすることもできます。 。
limit()和skip()都是用于截取Stream流中部分元素的方法,两者区别在于,limit()返回一个包含前n个元素的新流,skip()则返回一个丢弃前n个元素后剩余元素组成的新流。
int[] arr = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}; System.out.print("取数组前5个元素:"); Arrays.stream(arr).limit(5).forEach(n -> System.out.print(n + " ")); // 输出结果为:1 2 3 4 5 System.out.print("跳过前3个元素,取剩余数组元素:"); Arrays.stream(arr).skip(3).forEach(n -> System.out.print(n + " ")); // 输出结果为:4 5 6 7 8 9 10
Stream的终止操作是指执行Stream流链中最后一个步骤,到这一步就会结束整个流处理。在Java8中,Stream终止操作包括forEach、toArray、reduce、collect、min、max、count、anyMatch、allMatch、noneMatch、findFirst和findAny等。这些终止操作都有返回值。需要注意一点是,如果没有执行终止操作的话,Stream流是不会触发执行的,例如,一个没有终止操作的peek()方法代码是不会执行进而打印——
list.stream().peek(t -> System.out.println("ddd"))
当加上终止操作话,例如加上collect,就会打印出“ddd”——
list.stream().peek(t -> System.out.println("ddd")).collect(Collectors.toList());
下面按类别分别讲解各个终止操作的使用。
该forEach前面已经提到,这里不做过多介绍。
count可以统计流中元素的数量并返回结果。
假设有一个包含多个手机号字符串的列表,需要统计去重后的手机号数量,就可以使用count方法——
List<String> numbers = Arrays.asList("13378520000", "15138510000","13178520000", "15138510000"); long count = numbers.stream() .distinct()//去重 .count();//统计去重后的手机号 System.out.println(count); //打印结果:3
reduce()可以将流中的所有元素根据指定规则归约成一个结果,并将该结果返回。
常用语法格式如下:
Optional<T> result = stream.reduce(BinaryOperator<T> accumulator);
可见,reduce方法会返回一个Optional类型的值,表示归约后的结果,需要通过get()方法获取Optional里的值。
假设有一个包含多个手机号字符串的List列表,需要在去重之后,再将列表所有字符串拼按照逗号间隔接成一个字符串返回,那么就可以通过reduce来实现——
List<String> numbers = Arrays.asList("13378520000", "15138510000","13178520000", "15138510000"); Optional result = numbers.stream() .distinct() //去重 .reduce((a ,b) -> a+","+b);//指定规则为,相临两个字符通过逗号“,”间隔 System.out.println(result.get()); //打印结果:13378520000,15138510000,13178520000
collect的作用是将流中的元素收集到一个新的容器中,返回该容器。打个比喻,它就像一个采摘水果的工人,负责将水果一个个采摘下来,然后放进一个篮子里,最后将篮子交给你。我在前面的案例当中,基本都有用到collect,例如前面2.1的filter过滤用法中的List filterdNumbers = numbers.stream().filter(s -> s.startsWith("133")).collect(Collectors.toList()),就是将过滤出前缀为“133”的字符串,将这些过滤处理后的元素交给collect这个终止操作。这时collect就像采摘水果的员工,把采摘为前缀“133”的“水果”通过toList()方法收集到一个新的List容器当中,然后交给你。最后你就可以得到一个只装着前缀为“133”的元素集合。
在Java8的collect方法中,除里toList()之外,还提供了例如toSet,toMap等方法满足不同的场景,根据名字就可以知道,toSet()返回的是一个Set集合,toMap()返回的是一个Map集合。
min和max用来查找流中的最小值和最大值。
假设需要在查找出用户列表中年龄最小的用户,可以按照以下代码实现——
List<People> peopleList = Arrays.asList( new People("王二",20), new People("李二",30), new People("张四",31) ); //查找年龄最小的用户,若没有则返回一个null People people = peopleList.stream().min(Comparator.comparing(People::getAge)).orElse(null); System.out.println(people); //打印结果:People{name='王二', age=20}
max的用法类似,这里不做额外说明。
2.6.1、anyMatch
anyMatch用于判断,如果流中至少有一个元素满足给定条件,那么返回true,反之返回false,即 true||false为true这类的判断。
假设在一个手机号字符串的List列表当中,判断是否包含前缀为“153”的手机号,就可以使用anyMatch——
List<String> numbers = Arrays.asList("13378520000", "15138510000","13178520000", "15338510000"); boolean hasNum = numbers.stream().anyMatch(n -> n.startsWith("153")); System.out.println(hasNum); //打印结果:true
2.6.2、allMatch
allMatch用于判断,流中的所有元素是否都满足给定条件,满足返回true,反之false,即true&&false为false这类判断。
假设在一个手机号字符串的List列表当中,判断手机号是否都满足前缀为“153”的手机号,就可以用allMatch——
List<String> numbers = Arrays.asList("13378520000", "15138510000","13178520000", "15338510000"); boolean hasNum = numbers.stream().allMatch(n -> n.startsWith("153")); System.out.println(hasNum); //打印结果:false
2.6.3、noneMatch
noneMatch用于判断,如果流中没有任何元素满足给定的条件,返回true,如果流中有任意一个条件满足给定条件,返回false,类似!true为false的判断。
假设在一个手机号字符串的List列表当中,判断手机号是否都不满足前缀为“153”的手机号,就可以用noneMatch——
List<String> numbers = Arrays.asList("13378520000", "15138510000","13178520000", "1238510000"); //numbers里没有前缀为“153”的手机号 boolean hasNum = numbers.stream().noneMatch(n -> n.startsWith("153")); System.out.println(hasNum); //打印结果:true
这三个方法其实存在一定互相替代性,例如在3.6.1中,满足!anyMatch表示所有手机号都不为“153”前缀,才得到true,这不就是noneMatch,主要看在项目当中如何灵活应用。
2.7.1、findFirst
findFirst用于返回流中第一个元素,如果流为空话,则返回一个空的Optional对象——
假设需要对一批同手机号的黑名单用户按照时间戳降序排序,然后取出第一个即时间戳为最早的用户,就可以使用findFirst——
List<People> peopleList = Arrays.asList( new People("王二","13178520000","20210409"), new People("李二","13178520000","20230401"), new People("张四","13178520000","20220509"), new People("赵六","13178520000","20220109") ); /** * 先按照时间升序排序,排序后的结果如下: * People{name='王二', tel='13178520000', time='20210409'} * People{name='赵六', tel='13178520000', time='20220109'} * People{name='张四', tel='13178520000', time='20220509'} * People{name='李二', tel='13178520000', time='20230401'} * *排序后,People{name='王二', tel='13178520000', time='20210409'}成了流中的第一个元素 */ People people = peopleList.stream().sorted(Comparator.comparing(People::getTime)).findFirst().orElse(null); System.out.println(people); //打印结果:People{name='王二', tel='13178520000', time='20210409'}
2.7.2、findAny
findAny返回流中的任意一个元素,如果流为空,则通过Optional对象返回一个null。
假设有一个已经存在的黑名单手机号列表blackList,现在有一批新的手机号列表phoneNumber,需要基于blackList列表过滤出phoneNumber存在的黑名单手机号,最后从过滤出来的黑名单手机号当中挑选出来出来任意一个,即可以通过findAny实现——
//blackList是已经存在的黑名单列表 List<String> blackList = Arrays.asList("13378520000", "15138510000"); //新来的手机号列表 List<String> phoneNumber = Arrays.asList("13378520000", "13178520000", "1238510000","15138510000","13299920000"); String blackPhone = phoneNumber.stream() //过滤出phoneNumber有包含在blackList的手机号,这类手机号即为黑名单手机号。 .filter(phone -> blackList.contains(phone)) //获取过滤确定为黑名单手机号的任意一个 .findAny() //如果没有则返回一个null .orElse(null); System.out.println(blackPhone); //打印结果:13378520000
前面的案例主要都是以顺序流来讲解,接下来,就是讲解Stream的并行流。在大数据量处理场景下,使用并行流可以提高某些操作效率,但同样存在一些需要考虑的问题,并非所有情况下都可以使用。
3.1、什么是并行流:并行流的概念和原理
并行流是指通过将数据按照一定的方式划分成多个片段分别在多个处理器上并行执行,这就意味着,可能处理完成的数据顺序与原先排序好的数据情况是不一致的。主要是用在比较大的数据量处理情况,若数据量太少,效率并不比顺序流要高,因为底层其实就使用到了多线程的技术。
并行流的流程原理如下:
1、输入数据:并行流的初始数据一般是集合或者数组,例如Arrays.asList("13378520000", "13178520000", "1238510000","15138510000","13299920000");
2、划分数据:将初始数据平均分成若干个子集,每个子集可以在不同的线程中独立进行处理,这个过程通常叫“分支”(Forking),默认情况下,Java8并行流使用到了ForkJoinPool框架,会将Arrays.asList("13378520000", "13178520000", "1238510000","15138510000","13299920000")划分成更小的颗粒进行处理,可能会将该数组划分成以下三个子集:
[13378520000, 13178520000] [1238510000, 13338510000] [13299920000]
3、处理数据:针对划分好的子集并行进行相同的操作,例如包括过滤(filter)、映射(map)、去重(distinct)等,这个过程通常叫“计算”(Computing),例如需要过滤为前缀包括“133”的字符集合,那么,各个子集,就会处理得到以下结果:
[13378520000] [13338510000] []
4、合并结果:将所有子集处理完成的结果进行汇总,得到最终结果。这个过程通常叫“合并”(Merging),结果就会合并如下:
[13378520000,13338510000]
5、返回结果:返回最终结果。
通俗而言,就是顺序流中,只有一个工人在摘水果,并行流中,是多个工人同时在摘水果。
3.2、创建并行流:通过 parallel() 方法将串行流转换为并行流
可以通过parallel()方法将顺序流转换为并行流,操作很简单,只需要在顺序流上调用parallel()即可。
List<String> numbers = Arrays.asList("13378360000","13278240000","13178590000","13558120000"); //通过stream().parallel()方法创建一个并行流,使用map()方法将每个字符串转换为截取前7位的字符,最后使用collect()方法将结果收集到一个新列表中 List<String> filNums = numbers.stream().parallel().map(s -> s.substring(0,7)).collect(Collectors.toList()); System.out.println(filNums); //打印结果:[1337836, 1327824, 1317859, 1355812]
3.3、并行流的注意事项:并行流可能引发的线程安全,以及如何避免这些问题
在使用并发流的过程中,可能会引发以下线程安全问题:并行流中的每个子集都在不同线程运行,可能会导致对共享状态的竞争和冲突。
避免线程问题的方法如下:避免修改共享状态,即在处理集合过程当中,避免被其他线程修改集合数据,可以使用锁来保证线程安全。
使用无状态操作:在并行流处理过程尽量使用无状态操作,例如filter、map之类的,可以尽量避免线程安全和同步问题。
4.1、什么是 Optional:Optional 类型的作用和使用场景
在实际开发当中,Optional类型通常用于返回可能为空的方法、避免null值的传递和简化复杂的判断逻辑等场景。调用Optional对象的方法,需要通过isPresent()方法判断值是否存在,如果存在则可以通过get()方法获取其值,如果不存在则可以通过orElse()方法提供默认值,或者抛出自定义异常处理。
4.2、如何使用 Optional:如何使用 Optional 类型
使用Optional类型主要目的是在数据可能为空的情况下,提供一种更安全、更优雅的处理方式。
以下是使用Optional类型的常用方法:
4.2.1、ofNullable()和isPresent()方法
将一个可能为null的对象包装成Optional类型的对象,然后根据isPresent方法判断对象是否包含空值——
String str = null; Optional<String> optStr = Optional.ofNullable(str); if (optStr.isPresent()){ System.out.println("Optional对象不为空"); }else { System.out.println("Optional对象为空"); } //打印结果:Optional对象为空
4.2.2、get()方法
获取Optional对象中的值,如果对象为空则抛出NoSuchElementException异常——
String str = null; Optional<String> optStr = Optional.ofNullable(str); if (optStr.isPresent()){ System.out.println("Optional对象不为空"); }else { System.out.println("Optional对象为空"); optStr.get(); }
控制台打印结果:
Exception in thread "main" java.util.NoSuchElementException: No value present
at java.util.Optional.get(Optional.java:135)
at com.zhu.fte.biz.test.StreamTest.main(StreamTest.java:144)
Optional对象为空
4.2.4、orElse()方法
获取Optional对象中的值,如果对象为空则返回指定的默认值——
String str = null; Optional<String> optStr = Optional.ofNullable(str); if (optStr.isPresent()){ System.out.println("Optional对象不为空"); }else { System.out.println("Optional对象为空,返回默认值:" + optStr.orElse("null")); } //打印结果:Optional对象为空,返回默认值:null
当然,如果不为空的话,则能正常获取对象中的值——
String str = "测试"; Optional<String> optStr = Optional.ofNullable(str); if (optStr.isPresent()){ System.out.println("Optional对象不为空,返回值:" + optStr.orElse("null")); }else { System.out.println("Optional对象为空,返回默认值:" + optStr.orElse("null")); } //打印结果:Optional对象不为空,返回值:测试
那么,问题来了,它是否能判断“ ”这类空格的字符串呢,我实验了一下,
String str = " "; Optional<String> optStr = Optional.ofNullable(str); if (optStr.isPresent()){ System.out.println("Optional对象不为空,返回值:" + optStr.orElse("null")); }else { System.out.println("Optional对象为空,返回默认值:" + optStr.orElse("null")); } //打印结果:Optional对象不为空,返回值:
可见,这类空字符串,在orElse判断当中,跟StringUtils.isEmpty()类似,都是把它当成非空字符串,但是StringUtils.isBlank()则判断为空字符串。
4.2.5、orElseGet()方法
orElseGet()和orElse()类似,都可以提供一个默认值。两者区别在于,orElse方法在每次调用时都会创建默认值,而orElseGet只在需要时才会创建默认值。
4.3、Optional 和 null 的区别: Optional 类型与 null 值的异同
两者都可以表示缺失值的情况,两者主要区别为:Optional类型是一种包装器对象,可以将一个可能为空的对象包装成一个Optional对象。这个对象可以通过调用ofNullable()
、of()
或其他方法来创建。而null值则只是一个空引用,没有任何实际的值。
Optional类型还可以避免出现NullPointerException异常,具体代码案例如下:
String str = null; //错误示范:直接调用str.length()方法会触发NullPointerException //int length = str.length() //通过Optional类型避免NullPointerException Optional<String> optionalStr = Optional.ofNullable(str); if (optionalStr.isPresent()){//判断Optional对象是否都包含非空值 int length = optionalStr.get().length(); System.out.println("字符串长度为:" + length); }else { System.out.println("字符串为空!"); } //使用map()方法对Optional对象进行转换时,确保返回对结果不为null Optional<Integer> optionalLength = optionalStr.map(s -> s.length()); System.out.println("字符串长度为:" + optionalLength.orElse(-1)); // 使用orElse()方法提供默认值
除里以上常用的流处理之外,Java8还新增了一些专门用来处理基本类型的流,例如IntStream、LongStream、DoubleStream等,其对应的Api接口基本与前面案例相似,读者可以自行研究。
最后,需要注意一点是,在流处理过程当中,尽量使用原始类型数据,避免装箱操作,因为装箱过程会有性能开销、内存占用等问题,例如,当原始数据int类型被装箱成Integer包装类型时,这个过程会涉及到对象的创建、初始化、垃圾回收等过程,需要额外的性能开销。
以上がJava8 で Stream ストリーミング プログラミングを使用する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。