世界冠军之路：菜鸟车辆路径规划求解引擎研发历程

jiezi

6 年前

阿里妹导读：车辆路径规划问题（Vehicle Routing Problem, VRP）是物流领域最经典的优化问题之一，具有极大的学术研究意义和实际应用价值。菜鸟网络高级算法专家胡浩源带领仓配智能化算法团队经过两年的研发，逐步沉淀出了一套完善、强大的车辆路径规划求解引擎，为菜鸟内外部多项业务提供了技术支持。通过不断地对算法进行探索打磨，我们终于在车辆路径规划问题最权威的评测平台上打破了多项世界纪录，标志着菜鸟网络在此领域的技术研究已经进入世界前列。
问题介绍
车辆路径规划问题是运筹优化领域最经典的优化问题之一。在此问题中，有若干个客户对某种货物有一定量的需求，车辆可以从仓库取货之后配送到客户手中。客户点与仓库点组成了一个配送网络，车辆可以在此网络中移动从而完成配送任务。在求解此问题过程中，需要优化的决策变量为每个客户的配送任务应该分配到哪一辆车上，以及每辆车完成客户配送任务的先后顺序，优化目标为最小化使用的车辆数和车辆总行驶距离（通常情况下最小化车辆数为第一优化目标）。
以 i,j 表示配送网络中的节点（i,j∈{0,1,2,…,N}), 其中 0 表示仓库点，其它表示客户点），以 k 表示车辆（k∈{1,2,…,K}），以 [图片上传失败 …(image-4ad9e3-1554866885896)]
为决策变量，表示车辆 k 是否从 i 点行驶到 j 点。则标准的车辆路径规划问题可以使用以下数据规划的形式描述：

其中，表达式（1）表示优化目标为最小化使用车辆数；表达式（2）表示每个点有且仅有一辆车负责配送其所需要的货物；表达式（3）表示每辆车最多负责一条配送线路；表达式（4）表示网络中的流量平衡条件；表达式（5）表示每辆车负责配送的货物不超过其承载能力限制；表达式（6）为防止孤立子环出现的约束条件。
车辆路径规划问题在物流领域和生产领域的应用非常广泛。所以在实际应用中也出现了一些在标准问题的基础上增加了某些变化之后的变型问题。其中较为常见的包括：

CVRP：Capacitated VRP, 限制配送车辆的承载体积、重量等。
VRPTW：VRP with Time Windows, 客户对货物的送达时间有时间窗要求。
VRPPD：VRP with Pickup and Delivery, 车辆在配送过程中可以一边揽收一边配送，在外卖 O2O 场景中比较常见。
MDVRP：Multi-Depot VRP, 配送网络中有多个仓库，同样的货物可以在多个仓库取货。
OVRP：Open VRP, 车辆完成配送任务之后不需要返回仓库。
VRPB：VRP with backhauls, 车辆完成配送任务之后回程取货。

以上各类问题之间的关系可以通过图 1 表示：

经典求解算法
车辆路径规划问题是典型的 NP-hard 问题，非常具有挑战性。同时因为其在实际应用的巨大价值，学术界和工业界对此类问题的优化算法的探索已经持续了几十年的时间。已有的经典求解算法可以分为精确解算法和启发式算法两大类。
在精确解算法方面，最基本的方法为分支定界算法，虽然其能够从理论上保证在有限时间内获得最优解，但是在实际计算中存在计算耗时巨大的情况。为了提高求解效率，研究者们先后提出了多种 Branch-and-Cut 以及 Branch-Cut-and-Price 方法，大幅降低了算法的求解时间。但是对于实际应用中较大规模的问题而言（例如超过 200 个点的问题），精确解算法依然无法能够在合理的时间内完成计算。所以还有一大部分研究集中于启发式算法领域。
启发式算法的思想为通过一系列启发式的规则来构造和改变解，从而逐步提升解的质量。对于 VRP 而言，较为经典的启发式算法为 Clarke-Wright 算法等。此外，经过不断的探索研究，元启发式算法被证明在求解 VRP 方面具有很好的效果和效率。一些经过精心设计的元启发式算法，例如模拟退火、禁忌搜索、遗传算法、蚁群算法、变邻域搜索、自适应大规模邻域搜索算法等在求解 VRP 上有着非常好的表现。
菜鸟车辆路径规划引擎研发历程
阶段一：核心基础算法研发
在研发之初，菜鸟仓配智能化算法团队充分调研了 VRP 领域的相关学术论文和软件产品等，最终确定了以自适应大规模邻域搜索（Adaptive Large Neighborhood Search, ALNS）为核心算法进行算法引擎的建设。相对于其它算法，ALNS 算法的优势包括：

算法框架易于拓展，除了求解标准的 VRP 之外，还能够求解 VRPPD，MDVRP 等变型问题；
相对于普通的 Local Search 类型的算法，ALNS 在每一步搜索过程中能够探索更大的解空间；
ALNS 算法在搜索过程中能够自适应地选择合适的算子，从而对于不同类型的问题数据能够有比较稳定的良好求解结果；
通过设计实现不同类型的算子，ALNS 可以实现不同的搜索策略，从而便于算法的升级拓展。

经典的 ALNS 算法的主流程如图 2 所示：

如图 2 所示的 ALNS 算法的主要步骤为：

使用一定的规则构造一个初始解（即 Initial 过程）；
基于算子的权重，选择此次迭代过程中使用的 Ruin 算子和 Insert 算子；
对此次迭代的初始解执行 Ruin 操作，即将部分已经被车辆服务的客户点删除，使初始解成为一个不可行解；
对步骤（3）获得的解执行 Insert 操作，即对于还没有被车辆服务的客户点，将其插入到解中，尽量获得一个可行解；
基于优化目标函数评估步骤（4）获得的新的解，并根据一定的策略决定是否接受新解；
判断是否达到终止条件。如果是，则终止计算，返回当前找到的最好解；否则，基于此轮计算中算子的表现，更新算子的权重，并返回到步骤（2）。

以 ALNS 算法为核心，菜鸟仓配智能化算法团队完成了第一版 VRP 优化引擎的研发。对比测试结果表明其求解效果和效率显著优于 jsprit 等国际上流行的开源 VRP Solver。在此基础上，菜鸟仓配智能化算法团队还对引擎进行了服务化，从而更方便地服务于公司内外部用户。
阶段二：算法体系丰富与升级
为了更好地服务于公司内外部用户，菜鸟仓配智能化算法团队不断对 VRP 优化引擎的核心算法组件进行了丰富与升级。主要体现在以下几个方面：
1. 完善功能：在原算法核心框架的基础上，增加了对 Pickup and Delivery(车辆一边揽收一边派送)、Multi Trip（车辆多趟派送）等类型问题的支持；而且通过对实际业务问题的抽象，总结出了不同类型的优化目标方程（例如最小化阶梯定价的总成本、最小化配送时间等）以及约束条件（例如车辆行驶距离限制、车辆配送订单数限制、车辆跨区数限制等）。从而使求解引擎能够求解的问题更加全面广泛。
2. 丰富算子：为了提升引擎的求解效果和稳定性，菜鸟仓配智能化算法团队还在 VRP 求解引擎中增加了更加丰富的优化算子，例如不同类型的局部搜索算子（例如 Two-Opt, Three-Opt, Cross-Exchange 等）、不同类型的中间结果接受策略（例如 Greedy, Simulated Annealing 等）。
3. 提升效果：菜鸟仓配智能化算法团队还尝试了多种算法来提升引擎的求解效果，主要包括：

Guided ejection search（GES）：此算法通过不断尝试删减一辆车，并将此辆车服务的客户添加到其它车辆上，从而实现降低车辆的使用数。此算法在降低车辆数方面具有非常好的效果；
Fast local search（FLS）: 在搜索过程中，只搜索那些有希望改善当前解的的邻域空间，从而大幅降低搜索计算量，提升算法求解速度；
Guided local serach（GLS）: 在搜索过程中对局部最优解的某些特征施加惩罚项，从而改变搜索方向，避免陷入局部最优；
Edge assembly crossover（EAX）: 一种基于两个解生成一个新的解的方法，新生成的解能够很好的继承父代个体的空间结构；
Branch-and-Price-Based Large Neighborhood Search：此算法将 VRPTW 问题分解为了 Restricted Master Problem 和 Subproblem。其中在 Restricted Master Problem 中，基于一系列可行的路径，通过求解 Set Partition 问题来获得原问题的解；在 Subproblem 中，通过 Tabu Search 来搜索新的可行的路径；
Path-Relink：此算法的核心思想为通过从 initial solution 到 guiding solution 的逐步移动，探索两个解之间的广阔的邻域，从而有可能发现更好的解；
Hybrid Cluster and Heuristics：此算法是针对超大规模的问题而设计，首先通过合适的聚类算法对客户点进行聚类，从而将原问题分解为多个小规模的子问题，然后并行求解，最终将子问题的解组装成为原问题的解。

阶段三：算法并行化升级
对于大部分启发式算法而言，可以天然地通过并行化计算来提升搜索效率和效果，例如并行地计算评估多个相邻解的质量、向多个邻域方向进行搜索或者使用多种策略进行搜索等，甚至并行地使用多种算法进行搜索等。所以为了进一步提升 VRP 引擎的求解质量，菜鸟仓配智能化算法团队对 VRP 引擎进行了并行化升级。在此过程中，先后研发实现了三套并行化算法架构。
Population Island
Population Island 的算法架构如图 3 所示。在算法执行过程中，有若干个 Island 并行执行计算，每个 Island 独立地进行演化，其中各有一个 Master 和若干 Worker，其中 Worker 负责具体的搜索任务的计算执行，Master 负责任务的分配协调以及与其它 Island 之间的通信等。每隔一定的计算步数，各个 Island 的 Master 之间会相同通信，分享搜索过程中获得的知识，从而提升整体的搜索效率。

Parallel Memetic
Parallel Memetic 的算法架构如图 4 所示。整个算法可以分为两个阶段，第一个阶段的计算重点在于减少使用的车辆数（Delete Route），在此阶段中，若干个 Worker 并行计算，并每隔一定的步数相互通信分享信息。第一阶段结束之后，会获得若干中间结果，将这些结果作为第二阶段中每个 Worker 上的初始演化种群进行计算。第二阶段的计算重点在于降低车辆行驶距离（Reduce Distance），第二阶段的 Worker 之间同样有相互通信分享知识的机制，而且可以通过控制演化过程中父代个体的选择机制来进行动态地调节 Exploration 与 Exploitation。

Central Pool
Central Pool 的算法架构如图 5 所示。在算法中有若干个 Worker 负责具体的搜索任务，并将搜索得到的解返回到 Central Pool 中，由 Central Manager 对解进行排序、筛选、聚类等处理，然后 Central Manager 会依据当前 Central Pool 中的解集情况生成新的计算任务并发送给 Worker 执行。Central Manager 可以对解空间进行合理的刻画，并通过计算任务的管控分配在 Exploration 与 Exploitation 之间进行平衡，从而提升求解效率。

已获得成果
通过对优化算法的不断迭代升级，以及在工程架构上的更新完善，菜鸟网络的车辆路径规划引擎在服务内外部客户的同时也在技术沉淀上获得了重大成果。
在 VRP 算法领域，最权威的评测对比平台为欧洲独立研究机构 SINTEF 发起并管理的世界最好解榜单（Best Known Solution），其中包括了对 Solomon 数据集（1987 年提出）和 Gehring & Homberger 数据集（1999 年提出）共 356 份测试数据的世界纪录。全世界最顶尖的优化算法学者（例如 Jakub Nalepa, D. Pisinger, Yuichi Nagata 等）以及优化技术公司（例如 Quintiq 等）都不断地在此平台上刷新世界纪录，将车辆路径规划领域的技术逐渐地推向极致。
菜鸟网络仓配智能化算法团队在算法研发过程中也一直以此数据集为主要算法评估指标。随着算法的不断升级优化，在越来越多的数据上接近甚至持平世界纪录。
最终，在 2018 年 9 月，仓配智能化算法团队的算法终于获得了比世界纪录更好的结果，并经过了平台的验证，向全世界的研究者进行了公开。截止到 2019 年 4 月初，菜鸟网络在此评测数据集上共持有 48 项世界纪录，持有数量在众多研究团队中位居前列，这标志着菜鸟在这项领域的技术进入了世界顶尖水平，为菜鸟和集团赢得了巨大的技术影响力。
总结及展望
在历时两年的研发过程中，菜鸟仓配智能化算法团队的同学们付出了巨大的努力和心血。同时在这个过程中，集团多个事业部的兄弟团队在算法研究、工程技术等方面也提供了很多很好的专业建议，在此表示衷心的感谢！
在之后的工作中，菜鸟仓配智能化算法团队将会把 VRP 引擎打造成为更强大、稳定、易用的优化产品，为菜鸟和集团的各项业务发展提供技术支持，并有计划地向外输出，为中国的物流行业赋能提效。

本文作者：何柱、守初、本华阅读原文
本文来自云栖社区合作伙伴“阿里技术”，如需转载请联系原作者。