Rumah >Java >javaTutorial >Cara menggunakan pengaturcaraan penstriman Stream dalam Java8
Operasi perantaraan Strim merujuk kepada operasi pemprosesan data dalam rantaian strim, termasuk penapisan penapis, penukaran pemetaan peta, penggabungan Peta rata, penyahduplikasian yang berbeza, pengisihan, dsb. Operasi ini akan mengembalikan objek Stream baharu, yang boleh melakukan pemprosesan data yang kompleks dengan merantai berbilang operasi perantaraan. Perlu diingatkan bahawa operasi perantaraan perlu mempunyai operasi penamatan untuk dicetuskan.
Berikut menerangkan operasi perantaraan biasa Strim mengikut kategori.
Kaedah penapis() sering digunakan untuk melaksanakan penapisan data, iaitu, ia boleh menapis elemen yang memenuhi syarat tertentu daripada data sumber seperti koleksi dan tatasusunan, dan Kembalikan strim baharu.
Andaikan terdapat senarai nombor telefon mudah alih yang disenaraihitamkan, dan anda perlu menapis semua elemen bermula dengan "133", kemudian anda boleh menggunakan penapis() untuk mencapainya -
//将数组转换为一个字符串列表 List<String> numbers = Arrays.asList("13378520000","13278520000","13178520000","13358520000"); //通过stream()方法创建一个流,接着使用filter()方法过滤出前缀为“133”的元素,最终通过collect() 方法将结果收集到一个新列表中 List<String> filterdNumbers = numbers.stream().filter(s -> s.startsWith("133")).collect(Collectors.toList()); System.out.println(filterdNumbers); //打印结果:[13378520000, 13358520000]
Kaedah map() digunakan untuk memetakan setiap elemen dalam strim, menukarnya kepada elemen lain atau mengekstrak maklumat di dalamnya dan mengembalikan strim baharu.
Menurut dua kes berikut, pelajari map() untuk menukar elemen kepada elemen lain dan mengekstrak maklumat dalam elemen -
1.2.1 >
Andaikan terdapat senarai aksara nombor telefon bimbit anda perlu menentukan lokasi nombor telefon mudah alih berdasarkan 7 digit pertama, kemudian anda perlu mendapatkan 7 subrentetan pertama semua nombor telefon bimbit. Anda boleh menggunakan kaedah map() untuk mencapai ini:List<String> numbers = Arrays.asList("13378520000","13278520000","13178520000","13558520000"); //通过stream()方法创建一个流,使用map()方法将每个字符串转换为截取前7位的字符,最后使用collect()方法将结果收集到一个新列表中 List<String> filterdNumbers = numbers.stream().map(s -> s.substring(0,7)).collect(Collectors.toList()); System.out.println(filterdNumbers); //打印结果:[1337852, 1327852, 1317852, 1355852]
1.2.2 Ekstrak maklumat elemen
Andaikan terdapat senarai objek pengguna dan kami perlukan. untuk mengekstrak nombor telefon mudah alih setiap objek Ini boleh dicapai menggunakan kaedah map():List<People> peopleList = Arrays.asList( new People("王二","13378520000"), new People("李二","13278520000"), new People("张四","13178520000") ); //通过stream()方法创建一个流,使用map()方法提取每个用户的手机号,最后使用collect()方法将结果收集到一个新列表中 List<String> tel = peopleList.stream().map(People::getTel).collect(Collectors.toList()); System.out.println(tel); //打印结果:[13378520000, 13278520000, 13178520000]1.3 Peta rata: Gabungkan berbilang aliran ke dalam satu aliranKaedah flatMap() boleh. melaksanakan pemetaan banyak-ke-banyak, atau gabungkan berbilang senarai ke dalam satu operasi senarai.
1.3.1 Laksanakan pemetaan banyak-ke-banyak
Andaikan terdapat dua set senarai baki A dan B, dan setiap elemen kumpulan A perlu dimiliki oleh kumpulan B. Elemen ditambah secara berurutan, dan anda boleh menggunakan flatMap untuk melaksanakan pemetaan banyak-ke-banyak -List<Integer> listA = Arrays.asList(1, 2, 3); List<Integer> listB = Arrays.asList(4, 5, 6); List<Integer> list = listA.stream().flatMap(a -> listB.stream().map(b -> a +b)).collect(Collectors.toList()); System.out.println(list); //打印结果: [5, 6, 7, 6, 7, 8, 7, 8, 9]
1.3.2 Gabungkan berbilang senarai ke dalam satu senarai
Katakan terdapat senarai yang mengandungi berbilang senarai rentetan nombor telefon bimbit Sekarang anda perlu menggabungkan semua rentetan nombor telefon mudah alih ke dalam senarai Anda boleh menggunakan kaedah flatMap() untuk mencapai ini:List<List<String>> listOfLists = Arrays.asList( Arrays.asList("13378520000", "13278520000"), Arrays.asList("13178520000", "13558520000"), Arrays.asList("15138510000", "15228310000") ); List<String> flatMapList = listOfLists.stream().flatMap(Collection::stream).collect(Collectors.toList()); System.out.println(flatMapList); //打印结果:[13378520000, 13278520000, 13178520000, 13558520000, 15138510000, 15228310000]1.4. berbeza: alih keluar elemen pendua Kaedah distinct() boleh digunakan untuk mengalih keluar elemen pendua dalam strim dan menjana senarai tanpa pendua. Andaikan terdapat senarai yang mengandungi rentetan nombor telefon mudah alih yang berulang, anda boleh menggunakan distinct() untuk menyahgandakan operasi&mdash apabila beroperasi, anda perlu memastikan bahawa elemen dalam strim melaksanakan equals() dan hashCode(; ) kaedah, kerana kedua-dua kaedah ini adalah piawaian untuk menilai sama ada dua objek adalah sama. 1.5, diisih: Isih elemen Kaedah sorted() digunakan untuk mengisih unsur dalam strim. Andaikan anda perlu mengisih sekumpulan objek Orang mengikut umur Berikut ialah menyusun mengikut tertib menaik dan tertib menurun—
Cetak hasil:
Orang{name='王二', umur=20}Orang {name='Li Er', umur=30}Orang{name ='Zhang Si', umur=31}
1.5.2, tertib menurunGunakan kaedah terbalik() untuk mengisih dalam tertib terbalik, itu ialah, isikan dalam tertib menaik dalam tertib terbalik&mdash, umur=31}1.6 , peek: Lihat maklumat setiap elemen, tetapi jangan ubah suai status elemen dalam strimOrang{name='Li Er', umur=30}
Orang{name='Wang Er', umur=20}
Kaedah peek() digunakan untuk melihat elemen dalam strim tanpa mengubah status unsur dalam strim Anda boleh menggunakan Penggunaan pada mana-mana peringkat tidak akan menjejaskan operasi aliran, dan juga tidak akan menamatkan operasi aliran.
List<String> numbers = Arrays.asList("13378520000", "15138510000","13178520000", "15138510000"); List<String> disNumbers = numbers.stream().distinct().collect(Collectors.toList()); System.out.println(disNumbers); //打印结果:[13378520000, 15138510000, 13178520000]Cetak hasil:
13378520000
133132Ini adalah perbezaan terbesar antara kaedah peek() dan forEach.
kaedah peek() hampir sama dengan can be digunakan untuk merentasi unsur-unsur dalam aliran, tetapi terdapat perbezaan besar antara keduanya. Perkara utama ialah forEach ialah operasi penamatan dalam strim Setelah ia dipanggil, ini bermakna Strim telah diproses dan tiada lagi operasi boleh dilakukan. Contohnya, operasi seperti peta dan penapis tidak boleh dilakukan pada strim selepas forEach, tetapi peek Kaedahnya OK Seperti yang boleh dilihat dari kes di atas, selepas memanggil peek buat kali pertama untuk mencetak elemen, elemen juga boleh diikuti dengan operasi peta untuk memintas tiga digit pertama rentetan. .
limit()和skip()都是用于截取Stream流中部分元素的方法,两者区别在于,limit()返回一个包含前n个元素的新流,skip()则返回一个丢弃前n个元素后剩余元素组成的新流。
int[] arr = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}; System.out.print("取数组前5个元素:"); Arrays.stream(arr).limit(5).forEach(n -> System.out.print(n + " ")); // 输出结果为:1 2 3 4 5 System.out.print("跳过前3个元素,取剩余数组元素:"); Arrays.stream(arr).skip(3).forEach(n -> System.out.print(n + " ")); // 输出结果为:4 5 6 7 8 9 10
Stream的终止操作是指执行Stream流链中最后一个步骤,到这一步就会结束整个流处理。在Java8中,Stream终止操作包括forEach、toArray、reduce、collect、min、max、count、anyMatch、allMatch、noneMatch、findFirst和findAny等。这些终止操作都有返回值。需要注意一点是,如果没有执行终止操作的话,Stream流是不会触发执行的,例如,一个没有终止操作的peek()方法代码是不会执行进而打印——
list.stream().peek(t -> System.out.println("ddd"))
当加上终止操作话,例如加上collect,就会打印出“ddd”——
list.stream().peek(t -> System.out.println("ddd")).collect(Collectors.toList());
下面按类别分别讲解各个终止操作的使用。
该forEach前面已经提到,这里不做过多介绍。
count可以统计流中元素的数量并返回结果。
假设有一个包含多个手机号字符串的列表,需要统计去重后的手机号数量,就可以使用count方法——
List<String> numbers = Arrays.asList("13378520000", "15138510000","13178520000", "15138510000"); long count = numbers.stream() .distinct()//去重 .count();//统计去重后的手机号 System.out.println(count); //打印结果:3
reduce()可以将流中的所有元素根据指定规则归约成一个结果,并将该结果返回。
常用语法格式如下:
Optional<T> result = stream.reduce(BinaryOperator<T> accumulator);
可见,reduce方法会返回一个Optional类型的值,表示归约后的结果,需要通过get()方法获取Optional里的值。
假设有一个包含多个手机号字符串的List列表,需要在去重之后,再将列表所有字符串拼按照逗号间隔接成一个字符串返回,那么就可以通过reduce来实现——
List<String> numbers = Arrays.asList("13378520000", "15138510000","13178520000", "15138510000"); Optional result = numbers.stream() .distinct() //去重 .reduce((a ,b) -> a+","+b);//指定规则为,相临两个字符通过逗号“,”间隔 System.out.println(result.get()); //打印结果:13378520000,15138510000,13178520000
collect的作用是将流中的元素收集到一个新的容器中,返回该容器。打个比喻,它就像一个采摘水果的工人,负责将水果一个个采摘下来,然后放进一个篮子里,最后将篮子交给你。我在前面的案例当中,基本都有用到collect,例如前面2.1的filter过滤用法中的List filterdNumbers = numbers.stream().filter(s -> s.startsWith("133")).collect(Collectors.toList()),就是将过滤出前缀为“133”的字符串,将这些过滤处理后的元素交给collect这个终止操作。这时collect就像采摘水果的员工,把采摘为前缀“133”的“水果”通过toList()方法收集到一个新的List容器当中,然后交给你。最后你就可以得到一个只装着前缀为“133”的元素集合。
在Java8的collect方法中,除里toList()之外,还提供了例如toSet,toMap等方法满足不同的场景,根据名字就可以知道,toSet()返回的是一个Set集合,toMap()返回的是一个Map集合。
min和max用来查找流中的最小值和最大值。
假设需要在查找出用户列表中年龄最小的用户,可以按照以下代码实现——
List<People> peopleList = Arrays.asList( new People("王二",20), new People("李二",30), new People("张四",31) ); //查找年龄最小的用户,若没有则返回一个null People people = peopleList.stream().min(Comparator.comparing(People::getAge)).orElse(null); System.out.println(people); //打印结果:People{name='王二', age=20}
max的用法类似,这里不做额外说明。
2.6.1、anyMatch
anyMatch用于判断,如果流中至少有一个元素满足给定条件,那么返回true,反之返回false,即 true||false为true这类的判断。
假设在一个手机号字符串的List列表当中,判断是否包含前缀为“153”的手机号,就可以使用anyMatch——
List<String> numbers = Arrays.asList("13378520000", "15138510000","13178520000", "15338510000"); boolean hasNum = numbers.stream().anyMatch(n -> n.startsWith("153")); System.out.println(hasNum); //打印结果:true
2.6.2、allMatch
allMatch用于判断,流中的所有元素是否都满足给定条件,满足返回true,反之false,即true&&false为false这类判断。
假设在一个手机号字符串的List列表当中,判断手机号是否都满足前缀为“153”的手机号,就可以用allMatch——
List<String> numbers = Arrays.asList("13378520000", "15138510000","13178520000", "15338510000"); boolean hasNum = numbers.stream().allMatch(n -> n.startsWith("153")); System.out.println(hasNum); //打印结果:false
2.6.3、noneMatch
noneMatch用于判断,如果流中没有任何元素满足给定的条件,返回true,如果流中有任意一个条件满足给定条件,返回false,类似!true为false的判断。
假设在一个手机号字符串的List列表当中,判断手机号是否都不满足前缀为“153”的手机号,就可以用noneMatch——
List<String> numbers = Arrays.asList("13378520000", "15138510000","13178520000", "1238510000"); //numbers里没有前缀为“153”的手机号 boolean hasNum = numbers.stream().noneMatch(n -> n.startsWith("153")); System.out.println(hasNum); //打印结果:true
这三个方法其实存在一定互相替代性,例如在3.6.1中,满足!anyMatch表示所有手机号都不为“153”前缀,才得到true,这不就是noneMatch,主要看在项目当中如何灵活应用。
2.7.1、findFirst
findFirst用于返回流中第一个元素,如果流为空话,则返回一个空的Optional对象——
假设需要对一批同手机号的黑名单用户按照时间戳降序排序,然后取出第一个即时间戳为最早的用户,就可以使用findFirst——
List<People> peopleList = Arrays.asList( new People("王二","13178520000","20210409"), new People("李二","13178520000","20230401"), new People("张四","13178520000","20220509"), new People("赵六","13178520000","20220109") ); /** * 先按照时间升序排序,排序后的结果如下: * People{name='王二', tel='13178520000', time='20210409'} * People{name='赵六', tel='13178520000', time='20220109'} * People{name='张四', tel='13178520000', time='20220509'} * People{name='李二', tel='13178520000', time='20230401'} * *排序后,People{name='王二', tel='13178520000', time='20210409'}成了流中的第一个元素 */ People people = peopleList.stream().sorted(Comparator.comparing(People::getTime)).findFirst().orElse(null); System.out.println(people); //打印结果:People{name='王二', tel='13178520000', time='20210409'}
2.7.2、findAny
findAny返回流中的任意一个元素,如果流为空,则通过Optional对象返回一个null。
假设有一个已经存在的黑名单手机号列表blackList,现在有一批新的手机号列表phoneNumber,需要基于blackList列表过滤出phoneNumber存在的黑名单手机号,最后从过滤出来的黑名单手机号当中挑选出来出来任意一个,即可以通过findAny实现——
//blackList是已经存在的黑名单列表 List<String> blackList = Arrays.asList("13378520000", "15138510000"); //新来的手机号列表 List<String> phoneNumber = Arrays.asList("13378520000", "13178520000", "1238510000","15138510000","13299920000"); String blackPhone = phoneNumber.stream() //过滤出phoneNumber有包含在blackList的手机号,这类手机号即为黑名单手机号。 .filter(phone -> blackList.contains(phone)) //获取过滤确定为黑名单手机号的任意一个 .findAny() //如果没有则返回一个null .orElse(null); System.out.println(blackPhone); //打印结果:13378520000
前面的案例主要都是以顺序流来讲解,接下来,就是讲解Stream的并行流。在大数据量处理场景下,使用并行流可以提高某些操作效率,但同样存在一些需要考虑的问题,并非所有情况下都可以使用。
3.1、什么是并行流:并行流的概念和原理
并行流是指通过将数据按照一定的方式划分成多个片段分别在多个处理器上并行执行,这就意味着,可能处理完成的数据顺序与原先排序好的数据情况是不一致的。主要是用在比较大的数据量处理情况,若数据量太少,效率并不比顺序流要高,因为底层其实就使用到了多线程的技术。
并行流的流程原理如下:
1、输入数据:并行流的初始数据一般是集合或者数组,例如Arrays.asList("13378520000", "13178520000", "1238510000","15138510000","13299920000");
2、划分数据:将初始数据平均分成若干个子集,每个子集可以在不同的线程中独立进行处理,这个过程通常叫“分支”(Forking),默认情况下,Java8并行流使用到了ForkJoinPool框架,会将Arrays.asList("13378520000", "13178520000", "1238510000","15138510000","13299920000")划分成更小的颗粒进行处理,可能会将该数组划分成以下三个子集:
[13378520000, 13178520000] [1238510000, 13338510000] [13299920000]
3、处理数据:针对划分好的子集并行进行相同的操作,例如包括过滤(filter)、映射(map)、去重(distinct)等,这个过程通常叫“计算”(Computing),例如需要过滤为前缀包括“133”的字符集合,那么,各个子集,就会处理得到以下结果:
[13378520000] [13338510000] []
4、合并结果:将所有子集处理完成的结果进行汇总,得到最终结果。这个过程通常叫“合并”(Merging),结果就会合并如下:
[13378520000,13338510000]
5、返回结果:返回最终结果。
通俗而言,就是顺序流中,只有一个工人在摘水果,并行流中,是多个工人同时在摘水果。
3.2、创建并行流:通过 parallel() 方法将串行流转换为并行流
可以通过parallel()方法将顺序流转换为并行流,操作很简单,只需要在顺序流上调用parallel()即可。
List<String> numbers = Arrays.asList("13378360000","13278240000","13178590000","13558120000"); //通过stream().parallel()方法创建一个并行流,使用map()方法将每个字符串转换为截取前7位的字符,最后使用collect()方法将结果收集到一个新列表中 List<String> filNums = numbers.stream().parallel().map(s -> s.substring(0,7)).collect(Collectors.toList()); System.out.println(filNums); //打印结果:[1337836, 1327824, 1317859, 1355812]
3.3、并行流的注意事项:并行流可能引发的线程安全,以及如何避免这些问题
在使用并发流的过程中,可能会引发以下线程安全问题:并行流中的每个子集都在不同线程运行,可能会导致对共享状态的竞争和冲突。
避免线程问题的方法如下:避免修改共享状态,即在处理集合过程当中,避免被其他线程修改集合数据,可以使用锁来保证线程安全。
使用无状态操作:在并行流处理过程尽量使用无状态操作,例如filter、map之类的,可以尽量避免线程安全和同步问题。
4.1、什么是 Optional:Optional 类型的作用和使用场景
在实际开发当中,Optional类型通常用于返回可能为空的方法、避免null值的传递和简化复杂的判断逻辑等场景。调用Optional对象的方法,需要通过isPresent()方法判断值是否存在,如果存在则可以通过get()方法获取其值,如果不存在则可以通过orElse()方法提供默认值,或者抛出自定义异常处理。
4.2、如何使用 Optional:如何使用 Optional 类型
使用Optional类型主要目的是在数据可能为空的情况下,提供一种更安全、更优雅的处理方式。
以下是使用Optional类型的常用方法:
4.2.1、ofNullable()和isPresent()方法
将一个可能为null的对象包装成Optional类型的对象,然后根据isPresent方法判断对象是否包含空值——
String str = null; Optional<String> optStr = Optional.ofNullable(str); if (optStr.isPresent()){ System.out.println("Optional对象不为空"); }else { System.out.println("Optional对象为空"); } //打印结果:Optional对象为空
4.2.2、get()方法
获取Optional对象中的值,如果对象为空则抛出NoSuchElementException异常——
String str = null; Optional<String> optStr = Optional.ofNullable(str); if (optStr.isPresent()){ System.out.println("Optional对象不为空"); }else { System.out.println("Optional对象为空"); optStr.get(); }
控制台打印结果:
Exception in thread "main" java.util.NoSuchElementException: No value present
at java.util.Optional.get(Optional.java:135)
at com.zhu.fte.biz.test.StreamTest.main(StreamTest.java:144)
Optional对象为空
4.2.4、orElse()方法
获取Optional对象中的值,如果对象为空则返回指定的默认值——
String str = null; Optional<String> optStr = Optional.ofNullable(str); if (optStr.isPresent()){ System.out.println("Optional对象不为空"); }else { System.out.println("Optional对象为空,返回默认值:" + optStr.orElse("null")); } //打印结果:Optional对象为空,返回默认值:null
当然,如果不为空的话,则能正常获取对象中的值——
String str = "测试"; Optional<String> optStr = Optional.ofNullable(str); if (optStr.isPresent()){ System.out.println("Optional对象不为空,返回值:" + optStr.orElse("null")); }else { System.out.println("Optional对象为空,返回默认值:" + optStr.orElse("null")); } //打印结果:Optional对象不为空,返回值:测试
那么,问题来了,它是否能判断“ ”这类空格的字符串呢,我实验了一下,
String str = " "; Optional<String> optStr = Optional.ofNullable(str); if (optStr.isPresent()){ System.out.println("Optional对象不为空,返回值:" + optStr.orElse("null")); }else { System.out.println("Optional对象为空,返回默认值:" + optStr.orElse("null")); } //打印结果:Optional对象不为空,返回值:
可见,这类空字符串,在orElse判断当中,跟StringUtils.isEmpty()类似,都是把它当成非空字符串,但是StringUtils.isBlank()则判断为空字符串。
4.2.5、orElseGet()方法
orElseGet()和orElse()类似,都可以提供一个默认值。两者区别在于,orElse方法在每次调用时都会创建默认值,而orElseGet只在需要时才会创建默认值。
4.3、Optional 和 null 的区别: Optional 类型与 null 值的异同
两者都可以表示缺失值的情况,两者主要区别为:Optional类型是一种包装器对象,可以将一个可能为空的对象包装成一个Optional对象。这个对象可以通过调用ofNullable()
、of()
或其他方法来创建。而null值则只是一个空引用,没有任何实际的值。
Optional类型还可以避免出现NullPointerException异常,具体代码案例如下:
String str = null; //错误示范:直接调用str.length()方法会触发NullPointerException //int length = str.length() //通过Optional类型避免NullPointerException Optional<String> optionalStr = Optional.ofNullable(str); if (optionalStr.isPresent()){//判断Optional对象是否都包含非空值 int length = optionalStr.get().length(); System.out.println("字符串长度为:" + length); }else { System.out.println("字符串为空!"); } //使用map()方法对Optional对象进行转换时,确保返回对结果不为null Optional<Integer> optionalLength = optionalStr.map(s -> s.length()); System.out.println("字符串长度为:" + optionalLength.orElse(-1)); // 使用orElse()方法提供默认值
除里以上常用的流处理之外,Java8还新增了一些专门用来处理基本类型的流,例如IntStream、LongStream、DoubleStream等,其对应的Api接口基本与前面案例相似,读者可以自行研究。
最后,需要注意一点是,在流处理过程当中,尽量使用原始类型数据,避免装箱操作,因为装箱过程会有性能开销、内存占用等问题,例如,当原始数据int类型被装箱成Integer包装类型时,这个过程会涉及到对象的创建、初始化、垃圾回收等过程,需要额外的性能开销。
Atas ialah kandungan terperinci Cara menggunakan pengaturcaraan penstriman Stream dalam Java8. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!