计算机专业Q-learning算法在路径规划中的应用

改进Q-learning算法在路径规划中的应用摘要:Q-learning算法是环境未知条件下的有效强化学习算法,该算法在路径规划中被广泛应用。针对Q-learning算法在离散状态下存在运行效率低、学习速度慢等问题,提出一种改进的Q-learning算法,在栅格环境下进行仿真实验,并成功地应用在多障碍物环境下移动机器人路径规划,结果证明了算法的可行性。改进Q-learning算法可以以更快的速度收敛、学习次数明显减少、效率最大可提高20%。同时该算法框架对解决同类问题具有较强的通用性。关键词:路径规划;改进Q-learning算法;强化学习;栅格法;机器人:TP391文献标志码:AApplicationofimprovedQ-learningalgorithminpathplanningAbstract:Q-learningalgorithmisaneffectivereinforcementlearningalgorithmundertheconditionofunknownenvironment,whichiswidelyusedinpathplanning.AimingattheproblemoflowefficiencyandslowlearningindiscretestateofQ-learningalgorithm,animprovedQ-learningalgorithmisproposedtosimulateingridenvironment.Ithasbeensuccessfullyappliedtothepathplanningofamobilerobotinamultibarrierenvironment,andtheresultsprovethefeasibilityofthealgorithm.TheimprovedQ-learningalgorithmcanconvergefaster,reducethenumberoflearning,andincreasetheefficiencyby20%.Atthesametime,theframeworkofthealgorithmhasstronggeneralityforsolvingthesamekindofproblems.Keywords:pathplanning;improvedQ-learningalgorithm;reinforcementlearning;gridmethod;robot0引言移动机器人可以在人类不可到达或危险未知的地方完成任务,已经成功的运用在很多领域,在移动机器人研究领域中路径规划是一个关键的问题。路径规划问题已经有很多方法可以借鉴,如蚁群算法、人工磁场法、神经网络法等。本文采用改进的Q-learning算法进行最优路径规划,即指在可以满足预先设定的条件的同时,从起点出发沿最短路径不经过障碍物到达终点。Q-learning算法是环境未知条件下的有效强化学习算法,它的迭代是一个试错和探索的过程,其收敛的一个条件要求对每个可能的状态动作对都多次尝试,最终学到最优的控制策略。Q-learning算法因其不需要建立环境的模型、算法简单、易于使用,已在非线性控制、机器人规划、人工智能问题求解、组合优化和调度制等领域中得到应用。针对不同的应用方向很多人提出了改进的方法,改进后算法的学习效率都得到了一定的提高,但其改进的方法比较繁琐。Q-learning算法应用于路径规划时,存在着学习利率低、收敛速度慢等缺点,且相关研究大多停留在理论层面,缺少对实际问题的解决和实践。本文对Q-learning算法做出改进,并将其应用在多障碍物环境下移动机器人的路径规划,使其在短时间内以最优路径从起点移动到终点。验证了改进算法的高效性,为Q-learning算法的改进提供了新的思路。1建立环境模型1.1栅格法建模栅格法简单有效,对障碍物的适应能力强,可减少建模的复杂性,便于计算机存储与处理,也可以直观进行视觉判断,已被广泛用于环境建模方法中。本文通过建立一个n×m的栅格,结合二维直角坐标系来确定栅格位置,并对每个栅格从左至右,从上到下依次标明序号。如图1建立一个3×4的栅格。图13×4栅格1.2问题描述本文利用摄像头采集环境信息、识别障碍物、根据获取的实际信息采用栅格法建立环境模型、设定起点与终点、采用Q-learning算法进行路径规划、根据规划结果控制机器人行走,如图2所示。图2整体设计框图如图3所示,a图为摄像头获取的图像,b为MATLAB处理后的图像。从处理后的图像已经能够清楚的知道障碍物的位置坐标,由于采集回来的图像像素点过多,如果以像素点为单位进行计算势必会增加运算量,同时机器人体积较大,对单个像素点计算也没有意义。因此,本文对MATLAB处理后的图像分块化处理。设机器人最大尺寸可占m个像素点,对图像以m个像素为单位进行分块:采集环境信息栅格法建模设定起点终点规划路径执行行走命令其中,x,y分别为分块处理后每一块对应的坐标,r,c分比为获取实际环境图片的横向、纵向像素点数,公式(2)所求为x,y的最大值,c...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?