盒马是一个技术创新的公司,更是一个消费驱动的公司,回归消费者价值:买的到、买的好、买的方便、买的放心、买的开心。
盒马包含盒马鲜生、X 会员店、盒马超云、盒马邻里等多种业务模式,其中最核心的商业模式是线上线下一体化,最快 30 分钟到家的 O2O(即盒马鲜生)模式。
盒马精选全球品质商品,追求极致新鲜;结合品类特点和消费者购物体验预期,为不同品类选择最为高效的经营模式。盒马生鲜的销售占比达 60%~70%,是最核心的品类,该品类的特点是用户预期时效性高,非常适合盒马鲜生这种将门店开到用户周边的业态。
在考虑使用什么样的供应链模式前,需要均衡物流成本和库存成本。相同数量的商品,整件物流成本远低于包裹物流,冷链差异更加明显(暂时不考虑送货时效和规模效应)。反之库存越分散,需求不确定性越大,如果不能准确把握消费者需求,就提前将库存布局在门店,会导致很高的缺货和损耗,即库存成本高。
为了实现高效供需匹配,多种业务模式需要有配套的供应链支撑,盒马多种业务模式后端融合,尽量共享干线网络和库存,大幅提高资源利用率,提高供应链效率。
供应链算法本质上是在传统供应链方法上,借助算法和数据的力量提高效率。
1、电商行业供应链算法定位
电商行业算法主要分为基础算法和业务算法。
基础算法包括图像、语音、文本等。电商业务算法直观地分为三种,一、从前端(流量,用户*商品维度)来说,和视频网站和资讯网站区别不大,采用搜索、广告、推荐方法;二、从中端(零售,商品维度)来说,包括商品、价格和库存等预测与决策算法;三、从后端(物流,订单维度)来说,包括履约、仓储、配送等优化算法。广义的供应链算法包括,中端(零售和商品预测与决策)和后端(物流和订单优化),狭义的供应链算法只包括中端算法。
“牛鞭效应”是指供应链上的一种需求变异放大现象,使信息流从最终客户端向原始供应商传递时,无法有效地实现信息共享,使得信息扭曲而逐渐放大,导致了需求信息出现越来越大的波动,此信息扭曲的放大作用在图形上很像一个甩起来的牛鞭,因此被形象地成为“牛鞭效应”。
零售商是最接近消费者的企业,最能够感知与把握消费者需求,最有能力通过数据和算法来应对市场波动。
零售本质上是人货场的匹配。在企业日常运营中,首先公司内部会推出销售计划与策略,销售计划决定供应,供应能力决定库存,通过库存和履约能力决定短期销售上限,从而对销售进行调控,下一轮的销售计划参考以上历史信息,实现了完整的商业运行闭环。
高品质的商品是盒马一贯的追求。为了满足顾客极致的新鲜体验,盒马商品的货架期非常短,甚至还提供仅满足每日所需的只售一天的日日鲜系列商品,涵盖牛奶,蔬菜,肉禽等日常消费品类,成为行业标杆。即时的生鲜服务非常切合消费者需求,但是对供应链提出了很高的要求。
更短的售卖期,意味着更容易发生缺货或者损耗,对此,盒马供应链算法根据生鲜零售的特点,考虑天气、季节性、节假日、商品替代性、营销活动,线上线下陈列展示等因素,构建了一系列具有盒马特色的高精度需求预测模型,通过仿真系统优化库存,实现了高度自动化的订货系统,大幅降低人力成本的同时优化了库存指标。
盒马生鲜补货系统包括需求预测、库存模型、动态调控三个模块。需求预测部分由于数据量比较多,特征处理复杂,工作量占比最大;库存模型主要目的是平衡用户需求和库存成本,实现利益最大化;动态调控针对不符合销售预期的商品,自动生成营销活动与流量调控,降低库存水位,优化周转与损耗。
在技术深度和创新上,成功将时空异构图神经网络模型引入到商品销量预测需中,解决了复杂营销活动信息损失过大等问题,使得预测准确率显著提升。
从算法效果来说,盒马预测算法在阿里集团时序预测比赛主要数据集上获得冠军和亚军的好成绩,整体准确度高,通用性强。
从业务结果来说,生鲜订货系统算法建议采纳率稳定在 96% 以上,订货人效提升 70%,损耗率降低 30%,缺货率降低 25%。
行业影响力方面,盒马集成预测、库存、价格与调控于一体的算法解决方案,成功入围 2022 年 Franz Edelman 杰出成就奖总决赛。
盒马销售预测算法迭代路径分为简单模型、机器学习模型、深度时序模型、时空图网络模型四个阶段。简单模型贴近业务理解,确保覆盖全量 SKU;机器学习模型比较稳定,异常值较少,但是大量依赖特征工程,时序扩展性差;深度时序模型不依赖特征工厂,原始时序信息遗漏少,时序拓展性强;时空图网络模型考虑商品间的关联性和跨样本间的影响等。
在预测时,预测的主要信息是商品销量,考虑到活动对商品销量有影响,因此可以将商品和活动建立图关系;此外,其他对商品销量有影响的因素也可以纳入到图模型中;对于该模型来说,在每一个时间窗上就构成了一张商品销量和各种特征的异构图。在计算过程中,首先利用 GraphSage、GATNE 等算法提取每个时间切片上的图信息,由此获取到点的更新信息,往下传递获取到整个时序的信息。在实际应用中,图信息是辅助信息,主要的信息依然是时序信息;同时,时序模型可以根据不同的场景替换成不同的时序模型。
库存模型主要分为两部分,首先是单个 SKU 的库存量,其次是多个仓库的汇总量问题。新零售独有的场景,安全保留量是指当线上和线下共享库存时,线上的顾客是先下单后拿实物,线下的顾客是先拿实物后下单,这样会发生线上的顾客先下单的货物被线下的用户拿走了的问题,由此导致线上订单无法履约。因此在这样的场景中,需要通过控制参数,当库存小于某个值时,线上就不进行售卖,防止发生无法及时出货的风险。
在进行订货量决策时主要分为三步,首先是进行业务目标拆分,根据业务目标和场景差异,确定某个商品是应该侧重保缺货还是保损耗等;第二步是库存批次推断,例如我们仓库中有 10 件商品,其中有 5 件是临期产品,如果没有及时订货可能会由于临期产品过期而产生缺货,因此需要进行库存批次推断;第三步最优订货量计算,支持各种模型进行订货量预估。
由于生鲜商品保质期较短,虽然销售预测和库存模型会最大力度提升模型性能,但是依然存在少量商品订多或者订少的情况,尤其是订多的情况会带来很大的损耗。因此通过建立库存动态调控系统,实时监控销量并更新预测结果,进行库存预警,通过线上促销活动,APP 流量倾斜、线下门店折扣调整库存,尽量避免由于库存积压产生的损耗。该系统的难点在于流量和价格的联合调控,需要实现高频的流量决策和低频的价格决策全局最优。
A1:行业通常使用的是加权的 MAPE,即准确率= 1-(商品池的总误差/总真实销量)*100%。该误差是带有权重的,比如说某个商品真实销量较大,产生的误差也大,对于全局误差贡献也大,这样符合业务认知。
A2:主要参考了这篇时空同构图论文思想,结合自身场景,使用了异构图。Huang Y, Bi H K, Li Z, et al. STGAT: Modeling spatial-temporal interactions for human trajectory prediction[C]//Proceedings of the IEEE International Conference on Computer Vision. 2019: 6272-6281.
A3:使用什么简单模型不是关键,主要是能够覆盖全量 SKU,用于做兜底策略。常见的包括简单移动平均法,上周同期等。
以上是盒马供应链算法实战的详细内容。更多信息请关注PHP中文网其他相关文章!