关于深度学习:自动驾驶规划控制常用的控制方法有哪些

97次阅读

共计 3000 个字符,预计需要花费 8 分钟才能阅读完成。

作者:zhangjq@知乎
原文地址:https://zhuanlan.zhihu.com/p/483898434
编辑:一点人工一点智能
原文:主动驾驶布局管制罕用的管制办法有哪些?

管制是驱使车辆前行的策略。管制的指标是应用可行的管制量,最大限度地升高与指标轨迹的偏差、最大限度地提供乘客的舒适度等。

如上图所示,与管制模块输出相关联的模块有布局模块、定位模块和车辆信息等。其中定位模块提供车辆的地位信息,布局模块提供指标轨迹信息,车辆信息则包含档位、速度、加速度等。管制输出量则为转向、减速和制动量。
管制模块次要分为横向管制和纵向管制,依据耦合模式的不同能够分为独立和一体化两种办法。

01  管制办法

1.1 解耦管制

所谓解耦管制,就是将横向和纵向管制办法独立离开进行管制。

1.2 耦合管制

耦合管制思考到了横纵向管制时存在的耦合问题。一个典型的例子是汽车不能高速过弯,因为当纵向速度过高时,横向角速度须要有肯定的限度,否则离心力无奈满足向心加速度。

横纵一体的典型代表办法是线性时变模型预测管制,该办法在模型预测管制的根底上减少横纵向的联结束缚。如最大向心加速度束缚等。

1.3 横向管制

如上图横向管制能够分为几何办法、基于运动学模型办法和基于动力学模型的办法。

1.3.1 前馈管制

所谓前馈管制,即依据跟踪点信息对管制量进行提前适当的弥补。一个典型的例子是利用跟踪序列点中的曲率信息,对转角进行弥补。

1.3.2 Chained Form

链式零碎将非线性零碎进行多层线性化,它将零碎进行逐层合成,进而能够将零碎快慢化,相似于滤波零碎[3]。

零碎在 frenet 坐标下的模型:

通过反向积分估算,能够失去控制率:

1.3.3 Lyapunov

基于李雅普诺夫稳定性办法的设计能够使用在运动学和动力学模型上。其根本思维是首先建设运动学或者动力学模型,依据模型提出跟踪办法,而后建设李雅普诺夫函数,通过李雅普诺夫稳定性证实闭环零碎的渐近稳固[4]。
· 运动学模型

如上图所示,小车以后点为 P,跟踪目标点为 Pr。
是以后地位和指标点的位姿差,和
别离为参考速度和角速度。设计李雅普诺夫函数:

跟踪率设计:
最终通过限定

束缚设计参数,进而证实了跟踪率的渐近稳定性,即当 e → ∞时,→ 0。
· 动力学模型
首先建设动力学模型:

其中:

则误差为:

设计代价函数:

设计控制率:

最终证实渐进稳定性。

1.3.4 Pure Pursuit

纯跟踪是一种几何门路跟踪控制器。该控制器应用车辆静止和参考门路的几何关系来跟踪参考门路的控制器。该管制办法应用车辆后轴核心用作参考点。

依据上图可推到出前轮转角指令:

其中 R 为转弯半径,L 为车辆轴距,e 为车辆以后姿势和指标路点在横向上的误差,为前视间隔且。

依据上图试验数据所示前视间隔减少,跟踪抖动越来越小。较短的前视间隔可提供更准确的跟踪,而较长的前视间隔可提供更平滑的跟踪。PurePursuit 的另一个特色是,在转弯跟踪时,过大的前视间隔会导致“cutting corners”。Pure Pursuit 很难在稳定性和跟踪性能之间进行衡量。

1.3.5 Stanley

与当前轴为参考点的纯追赶纯跟踪办法不同,Stanley 控制器以前轴为参考点。它同时思考了航向误差和横向误差。Stanley 控制器不仅思考航向误差,而且还思考了横向误差。

依据上图可推到出前轮转角指令:

依据上图试验数据所示随着 k 的减少,跟踪性能也会进步。当车速变大时 Stanley 不像 Pure Pursuit 有足够的稳定性。

1.3.6 LQR

基于车辆运动学模型的办法疏忽了车辆的动力学个性,因而在车速过快或者曲率变化率过大的状况下该算法无奈满足车辆的稳定性管制要求。对于基于车辆动力学模型的管制办法,首要的工作是对车辆动力学进行建模。因为准确的二自由度动力学模型是非线性的,为了便于进行实时的跟踪管制计算,通常还须要在准确的二自由度动力学模型根底上进行一些简化近似,失去线性二自由度动力学模型。
· 车辆二自由度动力学模型:

· LQR:
线性二次调节器(Linear Quadratic Regulator 或 LQR)是基于模型的控制器,它应用车辆的状态来使误差最小化。LQR 实践是古代管制实践中倒退最早也最为成熟的一种状态空间设计法。LQR 可失去状态线性反馈的最优控制法则,易于形成闭环最优控制。
LQR 最优设计是指设计出的状态反馈控制器 K 要使二次型指标函数 J 取最小值,而 K 由权矩阵 Q 与 R 惟一决定,故此 Q、R 的抉择尤为重要。如下公式为 LQR 代价函数:

依据车辆动力学模型和 LQR 代价函数能够推到出代数里卡提方程:

最终通过迭代黎卡提方程计算反馈矩阵,再依据反馈矩阵获取最优控制量。

1.3.7 MPC

MPC(Model Prediction Control)是一种致力于将更长时间跨度, 甚至于无穷工夫的最优化管制问题, 合成为若干个更短时间跨度, 或者无限时间跨度的最优化管制问题, 并且在肯定水平上依然谋求最优解。
MPC 由如下三个因素组成:
1、预测模型: 预测模型可能在短时间内很好的预测零碎状态的变动;
2、在线滚动优化: 因为预测模型失去的后果与理论依然存在偏差, 所以采纳滚动优化找到每个时刻下的部分最优解, 通常状况会设计一个指标 (损失) 函数并将其转化为二次布局问题进而找到最优解;
3、校对: 到下一个工夫点依据新的状态从新进行预测和优化。
· 预测模型:
依据 LQR 中的车辆动力学模型能够推出预测模型。

· 滚动优化:
MPC 代价函数:

依据预测模型、车辆横向束缚、代价函数进行优化求解能够失去相应的控制指令。

1.3.8 横向控制算法比照

1.4 纵向

如上图所示,纵向管制个别采纳采纳串级 pid 管制办法。

02  具体设计

控制器的设计如上图所示,其中 Controller 为基类,LonController、LonController 和 MPCController 继承该基类。LonController 又衍生出 LQRController、LyapunovController 和 StanleyController 等子类。
参考文献

  1. Snider J M. Automatic steering methods for autonomous automobile path tracking[J]. Robotics Institute, Pittsburgh, PA, Tech. Rep. CMU-RITR-09-08,2009.
  2. Rajamani R. Vehicle dynamics and control[M]. Springer Science & Business Media, 2011.
  3. Minseong, Chae, Youngjin, et al. Dynamic Handling Characteristics Control of an in-Wheel-Motor Driven Electric Vehicle Based on Multiple Sliding Mode Control Approach[J]. IEEE Access, 2019, 7:132448-132458.
  4. 于浩. 非残缺轮式移动机器人静止布局与管制钻研[D]. 中国海洋大学.
    1、书籍举荐 -《机器人门路布局与合作:根底、算法与试验》
    2、最新|3D SLAM 对于 z 轴精度的优化思路整顿
    3、书籍举荐 -《卡尔曼滤波与信息交融》
    4、机器人静止|浅谈 Time Elastic Band 算法
    5、书籍举荐 -《大规模 SLAM 技术》
    6.、ROS 与挪动底盘通信
正文完
 0