目 录CONTENT

文章目录

利用强化学习训练扩散模型:伯克利研究团队实测100辆自动驾驶车缓解交通拥堵

Administrator
2026-05-24 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:http://bair.berkeley.edu/blog/2025/03/25/rl-av-smoothing/

原文作者:BAIR Blog


我们成功将100辆由强化学习 (RL) 控制的车辆投入到繁忙的高速公路早高峰中,旨在平滑交通拥堵并降低所有人的燃料消耗。我们的目标是解决令人沮丧的“走走停停”波(stop-and-go waves),这些波动通常没有明确的成因,却会导致严重的交通拥堵和能源浪费。

幽灵堵车的挑战

如果您经常开车,一定经历过这种莫名其妙的交通迟滞。这种波动源于驾驶行为的小幅度波动,并在交通流中被放大。由于人类驾驶员的反应时间存在延迟,往往会产生比前车更剧烈的刹车动作,这种效应会像多米诺骨牌一样向后传播,最终导致交通停滞,增加油耗和排放。

利用强化学习平滑交通波

我们利用强化学习(RL)通过与交通环境的交互学习优化策略,以抑制波动的传播。我们基于田纳西州 Nashville 的 I-24 高速公路实验数据构建了数据驱动的模拟环境,让 RL 代理在其中学习如何平滑交通流。关键优势在于,这些控制器仅需感知自身及前车的速度和距离,因此无需昂贵的外部基础设施即可在现代量产车上部署。

奖励设计

为了平衡波平滑、燃油效率、安全性和驾驶舒适度,我们设计了精密的奖励函数。如果过度强调燃油效率,RL 可能学会为了节能而在高速公路上停车;因此,我们引入了动态间距阈值,确保在节能的同时兼顾交通安全和人类驾驶习惯。

100辆车的大规模实测:从模拟到公路

基于模拟实验的成功,我们发起了名为“MegaVanderTest”的实测项目,将训练好的模型部署在100辆真实车辆上。实验证明,当公路上拥有少于 5% 的此类智控车辆时,即可显著改善周围车辆的驾驶效率,实现 15% 到 20% 的能源节省。

本次实验展示了去中心化控制在实际道路中的可行性。未来,我们将继续探索更快的仿真技术以及 5G 通信下的多智能体协作,以进一步消除交通拥堵,实现更绿色的出行。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区