對於報表資料大部分情況下使用寫sql的方式為大螢幕/報表提供資料來源,但是對於某些複雜情況下僅使用sql無法實現,或者實現起來困難的時候,會採取透過程式碼實現複雜的邏輯最終將結果回傳。
對於相對複雜的報表,經常需要做資料的連接即表與表的join,分組,計算等操作。 sql天然支援這些操作,實作起來很輕鬆。但是當我們在java程式碼中需要對資料進行連接時,原生支援的就並不那麼友好,我們常常會這麼實作
現在有兩個集合
List<ContractDetail> contractDetails; // 合同明细集合,合同会重复 List<ContractInfo> contractInfos; // 合同主要信息,不会有重复合同
對應資料結構
public class ContractDetail { /** * 合同编号 */ private String contractNo; /** * 总金额 */ private BigDecimal moneyTotal; } public class ContractInfo { /** * 合同编号 */ private String contractNo; /** * 状态 */ private String status; }
需求
contractDetails 根據contractNo關聯contractInfos,過濾出status = '已簽訂’的資料
再根據contractDetails 中的contractNo分組,分別求每個contractNo對應的moneyTotal總和
最終輸出的應該為一個map
Map<String /* 合同编码 */, BigDecimal /* 对应moneyTotal之和 */> result;
通常我們會這麼實作
// setp 1 过滤出 已签订状态的合同编码 Set<String> stopContract = contractInfos.stream() .filter(it -> "已签订".equals(it.getStatus())) .map(ContractInfo::getContractNo).collect(Collectors.toSet()); //step2 根据 step1的合同编码集合过滤出状态正确的contractDetail contractDetails = contractDetails.stream() .filter(it -> stopContract.contains(it.getContractNo())) .collect(Collectors.toList()); //step3 根据contractNo分别累加对应的moneyTotal Map<String, BigDecimal> result = new HashMap<>(); contractDetails.stream().forEach(it -> { BigDecimal moneyTotal = Optional.ofNullable(result.get(it.getContractNo())) .orElse(BigDecimal.ZERO); moneyTotal = moneyTotal.add(it.getMoneyTotal() != null ? it.getMoneyTotal() : BigDecimal.ZERO); result.put(it.getContractNo(), moneyTotal); });
顯然這個實作時比較複雜的,因為使用sql的話無非就是join 連線之後加上group by分組。求和。就可以輕易解決這個問題。那麼看看後面這個工具類,再思考有沒有更簡單的方法實作。
集合資料流CollectionDataStream的功能是透過介面對集合之間做關聯,實作了類似sql join和left join兩個動作
並且實作和java中的Stream相互轉換的功能。
聚合資料結構將集合轉換成類似表結構的資料結構,包含表名,資料
public class AggregationData { Map<String, Map> aggregationMap; private AggregationData(){ aggregationMap = new HashMap<>(); } //key 为别名,value为对应对象 public AggregationData(String tableName, Object data) { aggregationMap = new HashMap<>(); aggregationMap.put(tableName, BeanUtil.beanToMap(data)); } public Map<String, Map> getRowAllData() { return aggregationMap; } public Map getTableData(String tableName) { if (!aggregationMap.containsKey(tableName)) { throw new DataStreamException(tableName + ".not.exists"); } return aggregationMap.get(tableName); } public void setTableData(String tableName, Object data) { if(aggregationMap.containsKey(tableName)){ throw new DataStreamException(tableName+".has.been.exists!"); } aggregationMap.put(tableName, BeanUtil.beanToMap(data)); } private void setTableData(String tableName, Map<String, Object> data) { Map<String, Object> tableData = Optional.ofNullable(aggregationMap.get(tableName)).orElse(new HashMap<String, Object>()); tableData.putAll(data); aggregationMap.put(tableName, tableData); } public AggregationData copyAggregationData() { AggregationData aggregationData = new AggregationData(); for (String tableName : this.getRowAllData().keySet()) { aggregationData.setTableData(tableName, this.getRowAllData().get(tableName)); } return aggregationData; } }
AggregationData代表一行數據,aggregationMap的key為表名,value為對應的資料
來詳細看看這個介面
import java.util.Collection; import java.util.Map; import java.util.function.Function; import java.util.stream.Stream; public interface CollectionDataStream<T> { /** *将集合转化为数据流,并给一个别名 * @param tableName * @param collection * @return */ static CollectionDataStream<AggregationData> of(String tableName, Collection<?> collection) { return new CollectionDataStreamImpl(tableName, collection); } /** *将 Stream转化为数据流,并给一个别名 * @param tableName * @param collection * @return */ static CollectionDataStream<AggregationData> of(String tableName, Stream<?> collection) { return new CollectionDataStreamImpl(tableName, collection); } /** * 内连接,可自定义连接条件,使用双循环 * * @param tableName * @param collection * @param predict * @param <T1> * @return */ <T1> CollectionDataStream<T> join(String tableName, Collection<T1> collection, JoinPredicate<T, T1> predict); /** * 等值内连接,使用map优化 * * @param collection * @param tableName * @param aggregationMapper * @param dataValueMapper * @param <T1> * @param <R> * @return */ //等值条件推荐用法 <T1, R> CollectionDataStream<T> joinUseHashOnEqualCondition(String tableName, Collection<T1> collection, Function<T, R> aggregationMapper, Function<T1, R> dataValueMapper); /** * 左连接,可自定义连接条件,使用双循环 * * @param tableName * @param collection * @param predict * @param <T1> * @return */ <T1> CollectionDataStream<T> leftJoin(String tableName, Collection<T1> collection, JoinPredicate<T, T1> predict); /** * 等值左连接,使用map优化 * * @param collection * @param tableName * @param aggregationMapper * @param dataValueMapper * @param <T1> * @param <R> * @return */ <T1, R> CollectionDataStream<T> leftJoinUseHashOnEqualCondition( String tableName, Collection<T1> collection,Function<T, R> aggregationMapper, Function<T1, R> dataValueMapper); Stream<T> toStream(); Stream<Map> toStream(String tableName); <R> Stream<R> toStream(String tableName, Class<R> clzz); <R> Stream<R> toStream(Function<AggregationData, R> mapper); }
注意joinUseHashOnEqualCondition和join兩個方法的差別。
如果集合之間的連接時某個欄位等值連接,那麼使用joinUseHashOnEqualCondition,其內部使用的是map分組之後進行連接。而直接使用join的話連接條件可自訂,但是是透過雙重循環進行條件判斷,效率較低。因此等值情況下,使用joinUseHashOnEqualCondition效率更高。
還是已上面的需求為例
先進行兩個集合之間的連接
CollectionDataStream.of("t1", contractDetails) .joinUseHashOnEqualCondition( contractInfos.stream().filter(it -> "已签订".equals(it.getStatus())).collect(Collectors.toList()), "t2", agg -> agg.getTableData("t1").get("contractNo"), ContractInfo::getContractNo );
程式碼解析
CollectionDataStream.of("t1", contractDetails)
是將集合contractDetails轉換為表名為t1的資料流,
.joinUseHashOnEqualCondition( contractInfos.stream().filter( "t2", it -> "已签订".equals(it.getStatus())).collect(Collectors.toList()), agg -> agg.getTableData("t1").get("contractNo"), ContractInfo::getContractNo );
內連接contractInfos,同時給contractInfos起別名t2,連接條件是等值連接t1的contractNo和contractInfos的contractNol連接之後得到新的聚合資料流
當然也可以使用自訂的連接實作
CollectionDataStream.of("t1", contractDetails) .join("t2", contractInfos.stream().filter(it -> "已签订".equals(it.getStatus())).collect(Collectors.toList()), (agg, data) -> agg.getTableData("t1").get("contractNo").equals(data.getContractNo()) )
這裡透過內連接,那麼也起到了一個過濾的作用。連接完成之後我們還要分組進行計算,那麼就需要用到下一個工具類別
是對stram中原生Collectors的一個擴展,實現了更多做報表常用分組的一些操作,
MyCollectorspackage collector; import utils.NumberUtil; import java.math.BigDecimal; import java.util.Comparator; import java.util.Map; import java.util.function.Function; import java.util.stream.Collector; import java.util.stream.Collectors; public class MyCollectors { /** * 返回一个Collector用于对集合进行分组并且,对于组内有多个元素,只返回最后一个,其他的忽略 * 适用于明确分组key唯一的情况,value可为空 * 谨慎使用,如果分组有多条,会丢失数据!!! * @param keyMapper * @param <T> * @param <K> * @param <U> * @param <M> * @return */ public static <T, K, U, M extends Map<K, U>> Collector<T, ?, Map<K, U>> groupingByLast(Function<? super T, ? extends K> keyMapper, Function<? super T, ? extends U> valueMapper) { return Collectors.groupingBy(keyMapper, Collectors.reducing(null, valueMapper, (o1, o2) -> o2)); } /** * 传入一个keyMaper和一个比较器 * 根据key分组,组内使用比较器进行比较,最终得到一个最大结果 * @param keyMapper * @param comparator * @param <T> * @param <K> * @param <U> * @param <M> * @return */ public static <T, K, U, M extends Map<K, U>> Collector<T, ?, Map<K, T>> groupingByMaxComparator(Function<? super T, ? extends K> keyMapper, Comparator<T> comparator) { return Collectors.groupingBy(keyMapper, Collectors.collectingAndThen(Collectors.maxBy(comparator), it -> it.orElse(null))); } /** * 传入一个keyMaper和一个比较器 * 根据key分组,组内使用比较器进行比较,最终得到一个最小结果 * @param keyMapper * @param comparator * @param <T> * @param <K> * @param <U> * @param <M> * @return */ public static <T, K, U, M extends Map<K, U>> Collector<T, ?, Map<K, T>> groupingByMinComparator(Function<? super T, ? extends K> keyMapper, Comparator<T> comparator) { return Collectors.groupingBy(keyMapper, Collectors.collectingAndThen(Collectors.maxBy(comparator), it -> it.orElse(null))); } /** * 分组后组内按照指定字段求和 * @param keyMapper * @param <T> * @param <K> * @return */ public static <T, K> Collector<T, ?, Map<K, BigDecimal>> groupingAndSum(Function<? super T, ? extends K> keyMapper, Function<? super T, BigDecimal> valueMapper) { return Collectors.groupingBy(keyMapper, Collectors.reducing(BigDecimal.ZERO, valueMapper, NumberUtil::addNumbers)); } /** * 根据对象某个字段进行求和 * @param mapper * @param <T> * @return */ public static <T> Collector<T, ?, BigDecimal> sumByField(Function<? super T, ? extends BigDecimal> mapper) { return Collectors.reducing(BigDecimal.ZERO, mapper, NumberUtil::addNumbers); } /** * 求和 */ public static Collector<BigDecimal, ?, BigDecimal> sum() { return Collectors.reducing(BigDecimal.ZERO, NumberUtil::addNumbers); } }
Mapresult = CollectionDataStream.of("t1", contractDetails) .joinUseHashOnEqualCondition( contractInfos.stream().filter(it -> "60".equals(it.getStatus())).collect(Collectors.toList()), "t2", agg -> agg.getTableData("t1").get("contractNo"), ContractInfo::getContractNo ).toStream("s1", ContractDetail.class)//将数据流转换为 java原生Stream .collect(MyCollectors.groupingAndSum(ContractDetail::getContractNo, ContractDetail::getMoneyTotal));
這樣的實作顯然更加簡單,也減少了出錯的的機率,減少了程式碼量,提升了效率。
實現了集合之間的連接操作,並且是串流操作,可以一口氣不斷連接多個集合。
實作了與Stream之間的相互轉換。利用stream的功能可以實現各種複雜操作,例如過濾,轉換,分組等。
效率上有一定的保證,對於等值連接採用了Map優化,並且在內連接時,考慮使用後小表連大表進行優化,在一些情況下減少循環次數,在bean轉換為行聚合資料時使用cglib下的BeanMap減少記憶體的佔用和效能的消耗
以上是怎麼使用Java工具類別實作高效率撰寫報表的詳細內容。更多資訊請關注PHP中文網其他相關文章!