本发明属于自动驾驶,具体涉及一种自动驾驶车专用车道动态控制方法。
背景技术:
1、近年来,自动驾驶汽车逐步进入市场,自动驾驶技术的发展吸引了许多消费者和研究者的关注。目前,由于技术发展等因素的限制,自动驾驶车辆(connected andautonomous vehicle,cav)与人工驾驶车辆(human-driven vehicles,hdv)混合交通(后简称为混合交通)将在未来长时间内持续存在。
2、研究表明:自动驾驶车辆在混合车流中的保守行为使得自动驾驶车运行效率降低;混合车流中,人工驾驶车的效率也不能提高。基于此,自动驾驶车专用车道(后简称为专用车道)设置的研究应运而生,以希望通过分离两类车辆提高交通效率。然而,当自动驾驶车辆在混合交通的比例较低时,用于自动驾驶的专用车道没有有效被利用,反而会降低道路整体通行效率;另外,当专用车道对人工驾驶车辆开启时,人工驾驶车辆产生的变道行为会降低混合交通的稳定性。
3、综上所述,在不同自动驾驶车比例情况下,如何灵活地控制自动驾驶车道的开关情况是急需解决的问题。
技术实现思路
1、为了克服混合交通的通行效率低及稳定性差的不足,本发明提供了一种自动驾驶车专用车道动态控制方法,包括如下步骤:
2、获取自动驾驶车专用车道控制路段的道路交通数据;
3、将控制路段划分为多个长度相等的元胞,根据所述道路交通数据构建元胞更新模型,通过元胞更新模型获取相等时间步长内每个元胞内的车辆通过需求流数据和车辆变道需求流数据;
4、根据车辆通过需求流数据和车辆变道需求流数据获取控制路段的换道拥堵影响情况、各车道车速变化率和各车道的车速方差值,将换道拥堵影响情况、各车道车速变化率和各车道的车速方差值的综合状态作为状态空间,将控制路段是否开放自动驾驶车专用车道作为动作空间,设置奖励函数;使用状态空间和动作空间对深度强化学习模型的参数进行训练,并通过奖励函数判断训练后的深度强化学习模型是否收敛,若是,得到专用车道控制模型;
5、将自动驾驶车专用车道控制路段的道路交通数据输入专用车道控制模型,通过专用车道控制模型对自动驾驶车专用车道的开关进行动态控制。
6、优选的,获取自动驾驶车专用车道控制路段的道路交通数据,具体为:依据道路监测系统的布设距离,将控制路段离散为多个网络间隔,在每个网络间隔内部属2-3个道路监测摄像头,通过道路监测摄像头进行道路交通数据的收集。
7、优选的,所述道路交通数据包括控制路段内的车流特征与车速变化值,其中,所述车流特征包括控制路段内的当前车辆数、换道车辆数和车速。
8、优选的,所述控制路段的数量为多个,所述动作空间为每个控制路段是否开放自动驾驶车专用车道。
9、优选的,所述元胞更新模型为:
10、
11、其中,表示第t个时间间隔内初始时刻元胞(i,j)上的自动驾驶车辆数;表示第t+1个时间间隔内初始时刻元胞(i,j)上的自动驾驶车辆数;表示第t个时间间隔内从元胞(i,j)流入元胞(i+1,j)的自动驾驶车辆数;表示第t个时间间隔内从元胞(i-1,j)流入元胞(i,j)的自动驾驶车辆数;表示第t个时间间隔内从元胞(i,j)流入元胞(i+1,j')的自动驾驶车辆数,i为一条车道上的元胞索引,j为车道的索引,j'表示与j车道相邻的其他两个车道。
12、优选的,所述奖励函数为:
13、
14、其中,γ1、γ2、γ3、γ4为各影响因素的权重值;n和nmax表示控制路段内1车道的车辆数与最大车辆数;表示控制路段内t时刻1车道的平均车速;表示控制路段内t+1时刻1车道的平均车速;表示控制路段内t时刻2车道的平均车速;表示控制路段内t+1时刻2车道的平均车速;表示控制路段内t时刻3车道的平均车速;表示控制路段内t+1时刻3车道的平均车速;σk表示控制路段内k车道的车速方差值;fi,j,j'表示t时刻从元胞(i,j)流入元胞(i+1,j')的车辆数。
15、优选的,所述深度强化学习模型为dqn算法。
16、本发明还提供有一种自动驾驶车专用车道动态控制系统,包括:
17、数据获取模块,用于获取自动驾驶车专用车道控制路段的道路交通数据;
18、元胞更新模型构建模块,用于将控制路段划分为多个长度相等的元胞,根据所述道路交通数据构建元胞更新模型,通过元胞更新模型获取相等时间步长内每个元胞内的车辆通过需求流数据和车辆变道需求流数据;
19、专用车道控制模型构建模块,用于根据车辆通过需求流数据和车辆变道需求流数据获取控制路段的换道拥堵影响情况、各车道车速变化率和各车道的车速方差值,将换道拥堵影响情况、各车道车速变化率和各车道的车速方差值的综合状态作为状态空间,将控制路段是否开放自动驾驶车专用车道作为动作空间,设置奖励函数;使用状态空间和动作空间对深度强化学习模型的参数进行训练,并通过奖励函数判断训练后的深度强化学习模型是否收敛,若是,得到专用车道控制模型;
20、车道控制模块,用于将自动驾驶车专用车道控制路段的道路交通数据输入专用车道控制模型,通过专用车道控制模型对自动驾驶车专用车道的开关进行动态控制。
21、本发明还提供有一种计算机设备,包括存储器和处理器;所述存储器存储有计算机程序,所述处理器用于运行所述存储器内的计算机程序,以执行所述自动驾驶车专用车道动态控制方法。
22、本发明还提供有一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行所述自动驾驶车专用车道动态控制方法。
23、本发明提供的自动驾驶车专用车道动态控制方法具有以下有益效果:
24、本发明通过根据所述道路交通数据构建元胞更新模型能够获取当前元胞内的车辆通过需求流数据和车辆变道需求流数据,从而直观地表现出交通流信息;通过车辆通过需求流数据和车辆变道需求流数据能够获取控制路段的换道拥堵影响情况、各车道车速变化率和各车道的车速方差值,将换道拥堵影响情况、各车道车速变化率和各车道的车速方差值的综合状态作为状态空间,将控制路段是否开放自动驾驶车专用车道作为动作空间,能够对深度强化学习模型对复杂非线性的交通系统进行学习和优化,得到更好的混合交通流自动驾驶车专用车道控制模型,解决直接运用深度强化学习模型造成的交通系统混乱问题;通过将元胞更新模型与专用车道控制模型两者结合起来对自动驾驶车专用车道的开关进行动态控制,既能解决面对复杂非线性交通系统时存在的维度爆炸的问题,同时避免了强化学习模型学习阶段不成熟的交通控制对实际交通系统产生的危害,增强混合交通流的稳定性,提高交通流效率。
1.一种自动驾驶车专用车道动态控制方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的自动驾驶车专用车道动态控制方法,其特征在于,获取自动驾驶车专用车道控制路段的道路交通数据,具体为:依据道路监测系统的布设距离,将控制路段离散为多个网络间隔,在每个网络间隔内部属2-3个道路监测摄像头,通过道路监测摄像头进行道路交通数据的收集。
3.根据权利要求1所述的自动驾驶车专用车道动态控制方法,其特征在于,所述道路交通数据包括控制路段内的车流特征与车速变化值,其中,所述车流特征包括控制路段内的当前车辆数、换道车辆数和车速。
4.根据权利要求1所述的自动驾驶车专用车道动态控制方法,其特征在于,所述控制路段的数量为多个,所述动作空间为每个控制路段是否开放自动驾驶车专用车道。
5.根据权利要求1所述的自动驾驶车专用车道动态控制方法,其特征在于,所述元胞更新模型为:
6.根据权利要求1所述的自动驾驶车专用车道动态控制方法,其特征在于,所述奖励函数为:
7.根据权利要求1所述的自动驾驶车专用车道动态控制方法,其特征在于,所述深度强化学习模型为dqn算法。
8.一种自动驾驶车专用车道动态控制系统,其特征在于,包括:
9.一种计算机设备,其特征在于,包括存储器和处理器;所述存储器存储有计算机程序,所述处理器用于运行所述存储器内的计算机程序,以执行权利要求1-7任一项所述的自动驾驶车专用车道动态控制方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行权利要求1-7任一项所述的自动驾驶车专用车道动态控制方法。