本发明涉及机器人运动规划,特别是指一种受空间关系记忆启发的机器人运动规划方法及装置。
背景技术:
1、运动规划是机器人系统中的一项关键技术,在交通系统、医疗系统等各个领域中具有显著的应用前景。运动规划的目标是找到在决策空间中找到一条连接起点和目标点的无碰撞路径,并且在理想情况下使得路径成本最小。然而,现实世界的决策空间通常含有大量连续变量以及高维的非结构化空间,这极大地增加了运动规划的复杂性。因此,在高维连续空间中实现快速可靠的运动规划方法对于提升其实际应用至关重要。
2、经典的运动规划解决方案大致可以分为两类:基于搜索的方法和基于采样的方法。基于搜索的方法,将规划问题概念化为图搜索问题。基于采样的方法,包括快速探索随机树和概率路线图,通过在配置空间中随机采样构建连接起点和目标点的探索树。然而,经典方法在应对高维规划问题时往往效率低下。在高维连续的环境中,基于学习的规划方法是提升运动规划性能的关键手段。现有的规划方法在面临高维连续环境仍存在以下挑战。
3、传统规划方法基于均匀采样策略来构建随机几何图,即无差别的探索整个空间,未能充分利用实际问题本身的结构信息。可能会导致不必要节点探索或者存在不合适的边和节点,因此在应对新问题时效果不佳,无法有效推广。当面临速度快或距离近的障碍时,机器人必须能快速精准的做出决策避开障碍。传统的规划方法往往关注节点位置信息,并且独立地处理每个任务,未能充分利用以往的经验和已建立的数据模型。
4、人脑在决策和推理过程中具有天然的优势,其中空间关系记忆在这个过程中至关重要。有研究表明人脑可以将决策问题转化为一个与感官观察对应的图结构,关系记忆将感官观察与其结构关系整合,从而促进感官推理。一方面,人类可以从稀疏的观察中进行复杂推理,并通过整合先前经验和当前环境信息快速决策,这种能力与海马体-内嗅皮层系统相关。另一方面,空间记忆对人类的生存至关重要,人类使用“认知地图”来结构化理解世界,这一过程与海马体密切相关。因此,为了应对上述两个挑战,本发明设计了一种受脑启发的基于图神经网络(graph neural network,gnn)规划器以提高规划效率和可扩展性,称为类脑运动规划(brainy motion planning,brainymp)。
5、近年来,基于学习的规划方法是提升高维连续运动规划性能的最有前景的方法。这类规划方法通过利用神经网络强大的学习和表示能力,机器人可以从数据中学习高维空间中的模式和专家规划器的行为轨迹。因此,规划过程中的策略(如采样机制)可以得到优化,从而在高维连续空间中取得优异的表现。基于学习的方法将运动规划视为一个序列决策问题,通常可以通过强化学习来解决。先前的工作提出了各种基于神经网络的运动规划器,包括基于卷积神经网络、递归神经网络和图神经网络的规划器。
6、基于gnn的规划器在处理高维连续规划任务方面表现出显著的能力,如gnn-explorer和graphmp。通过访问通过均匀采样形成的随机几何图,这些规划器能够捕捉环境的几何模式,从而无需编码整个工作空间即可实现更高效的探索。尽管基于gnn的规划器在高维连续任务中表现出色,但仍存在一些局限性:在构建初始随机几何图(randomgeometric graph,rgg)时,对均匀采样得到的节点这一过程忽略了环境拓扑,可能导致不必要的节点探索;在rgg的边形成过程中,可能存在与障碍物碰撞的边,从而降低规划的可靠性;在模型提取关键图模式时,现有方法主要编码节点的位置关系,而忽略了节点间的结构关系,阻碍了模型表达能力的提升。
7、在现有技术中,缺乏一种基于人脑空间记忆启发的高效且准确的机器人运动规划方法。
技术实现思路
1、为了解决现有技术存在的节点探索效率低、运动路线规划可靠性差的技术问题,本发明实施例提供了一种受空间关系记忆启发的机器人运动规划方法及装置。所述技术方案如下:
2、一方面,提供了一种受空间关系记忆启发的机器人运动规划方法,该方法由机器人运动规划设备实现,该方法包括:
3、获取运动起始位置信息、运动目标位置信息、障碍物位置信息和地图信息;
4、基于选择性采样策略,根据所述运动起始位置信息、运动目标位置信息以及地图信息,在机器人的构型空间中,通过k-nn算法构建第一随机几何图;
5、基于预设的置信度阈值,将所述第一随机几何图以及所述障碍物位置信息输入所述智慧边缘选择器进行边筛选,获得第二随机几何图;
6、根据所述第二随机几何图,通过所述记忆感知预测器进行启发值计算,得到节点启发值;
7、基于可微模块,根据所述节点启发值以及所述第二随机几何图,使用快捷路径探索方法进行最优路径搜索,获得第二最优路径。
8、另一方面,提供了一种受空间关系记忆启发的机器人运动规划装置,该装置应用于受空间关系记忆启发的机器人运动规划方法,该装置包括:
9、信息获取模块,用于获取运动起始位置信息、运动目标位置信息、障碍物位置信息和地图信息;
10、第一随机几何图构建模块,用于基于选择性采样策略,根据所述运动起始位置信息、运动目标位置信息以及地图信息,在机器人的构型空间中,通过k-nn算法构建第一随机几何图;
11、第二随机几何图构建模块,用于基于预设的置信度阈值,将所述第一随机几何图以及所述障碍物位置信息输入所述智慧边缘选择器进行边筛选,获得第二随机几何图;
12、启发值计算模块,用于根据所述第二随机几何图,通过所述记忆感知预测器进行启发值计算,得到节点启发值;
13、最优路径获取模块,用于基于可微模块,根据所述节点启发值以及所述第二随机几何图,使用快捷路径探索方法进行最优路径搜索,获得第二最优路径。
14、另一方面,提供一种机器人运动规划设备,所述机器人运动规划设备包括:处理器;存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如上述受空间关系记忆启发的机器人运动规划方法中的任一项方法。
15、另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现上述受空间关系记忆启发的机器人运动规划方法中的任一项方法。
16、本发明实施例提供的技术方案带来的有益效果至少包括:
17、本发明提出一种受空间关系记忆启发的机器人运动规划方法。在人类大脑在决策和关系推理过程中,空间关系记忆相关脑机制表现出明显的优势。基于此,设计了一种新的基于图神经网络的类脑运动规划,用以提升在高维连续环境下机器人规划的性能。在构建随机几何图时,通过一种新的随机几何图生成方法,是采样节点更逼近最优解,提高了搜索效率;通过智能边缘选择器,保留了在随机几何图中置信度最高的边,避免了不合理边对运动规划产生负面影响;通过记忆感知预测器,模仿大脑关系记忆将感官观察信息与关系结构整合用于感官推理这一脑机制,将子图结构引入节点特征提升了图神经网络的图表示能力,增强了模型整体的学习效果。本发明是一种受人脑空间关系记忆启发的高效且准确的机器人运动规划方法。
1.一种受空间关系记忆启发的机器人运动规划方法,其特征在于,所述方法包括:
2.根据权利要求1所述的受空间关系记忆启发的机器人运动规划方法,其特征在于,所述基于选择性采样策略,根据所述运动起始位置信息、运动目标位置信息以及地图信息,在机器人的构型空间中,通过k-nn算法构建第一随机几何图,包括:
3.根据权利要求1所述的受空间关系记忆启发的机器人运动规划方法,其特征在于,所述智慧边缘选择器包括编码层、transformer层和隐藏层;
4.根据权利要求3所述的受空间关系记忆启发的机器人运动规划方法,其特征在于,所述基于预设的置信度阈值,将所述第一随机几何图以及所述障碍物位置信息输入所述智慧边缘选择器进行边筛选,获得第二随机几何图,包括:
5.根据权利要求1所述的受空间关系记忆启发的机器人运动规划方法,其特征在于,所述记忆感知预测器包括子图提取层、图编码层、线性层、池化层和输出层。
6.根据权利要求5所述的受空间关系记忆启发的机器人运动规划方法,其特征在于,所述根据所述第二随机几何图,通过所述记忆感知预测器进行启发值计算,得到节点启发值,包括:
7.根据权利要求1所述的受空间关系记忆启发的机器人运动规划方法,其特征在于,所述基于可微模块,根据所述节点启发值以及所述第二随机几何图,使用快捷路径探索方法进行最优路径搜索,获得第二最优路径,包括:
8.一种受空间关系记忆启发的机器人运动规划装置,所述受空间关系记忆启发的机器人运动规划装置用于实现如权利要求1-7任一项所述受空间关系记忆启发的机器人运动规划方法,其特征在于,所述装置包括:
9.一种机器人运动规划设备,其特征在于,所述机器人运动规划设备包括:
10.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行如权利要求1至7任一项所述的方法。
