在人工智能领域中 ,强化学习理论由于其自学习性和自适应性的优点而得到了广泛关注 随着分布式人工智能中多智能体理论的不断发展 ,分布式强化学习算法逐渐成为研究的重点 首先介绍了强化学习的研究状况 ,然后以多机器人动态编队为研究模型 ,阐述应用分布式强化学习实现多机器人行为控制的方法 应用SOM神经网络对状态空间进行自主划分 ,以加快学习速度 ;应用BP神经网络实现强化学习 ,以增强系统的泛化能力 ;并且采用内、外两个强化信号兼顾机器人的个体利益及整体利益 为了明确控制任务 ,系统使用黑板通信方式进行分层控制 最后由仿真实验证明该方法的有效
This research project is an effort towards achieving robot cooperation to complete a set of tasks. T...
本文作者在研究多机器人协调的基础上,将多机器人作为一个整体,从系统的角度研究多机器人系统的整体行为和组织结构.以人工智能的多自主体系统为理论基础,以网络通讯和分布数据库为技术基础,设计了多机器人分布自...
Существует множество методов решения задач машинного обучения, каждый из которых применяется в зави...
在多机器人系统中 ,评价一个机器人行为的好坏常常依赖于其它机器人的行为 ,此时必须采用组合动作以实现多机器人的协作 ,但采用组合动作的强化学习算法由于学习空间异常庞大而收敛得极慢 .本文提出的新方法通...
对多机器人的体系结构进行了研究 .采用时空表和时间控制器相结合的方法 ,解决多机器人间的协调协作问题 .针对编队问题的具体特性 ,提出了基于环境的记忆学习方法 ,使多机器人编队系统具有较强的环境自适应...
对目前世界上分布式强化学习方法的研究成果加以总结,分析比较了独立强化学习、社会强化学习和群体强化学习三类分布式强化学习方法的特点、差别和适用范围,并对分布式强化学习仍需解决的问题和未来的发展方向进行了...
通过对协作机器人的构型进行分析研究,得出了偏置是影响机器人构型的一个重要因素。首先,对现有典型协作机器人的构型进行分析,通过构型间的内在联系与演化过程得到构型之间的差异。然后利用构型之间的差异引出了偏...
移动边缘计算是解决机器人大计算量任务需求的一种方法;传统算法基于智能算法或凸优化方法,迭代时间长。深度强化学习可以通过一次前向传递即可求解,但只可以针对固定数量机器人进行求解。通过对深度强化学习分析研...
Reinforcement learning has been widely applied to solve a diverse set of learning tasks, from board ...
针对Internet多机器人系统中存在的操作指令延迟、工作效率低、协作能力差等问题,提出了多机器人神经元群网络控制模型。在学习过程中,来自不同功能区域的多类型神经元连接形成动态神经元群集,来描述各机器...
[[abstract]]摘要 本研究引用三種控制法則,配合縱隊、橫隊、鑽石隊型、以及倒V 字型,四 種隊型安排,來探討群組機器人的隊型控制,研究中規劃了四項基本行為及二項 複雜行為來驗証各配對,並在自...
机器鱼水球比赛是进行多机器鱼协作研究的标准平台.考虑在机器鱼水球比赛中的协作顶球策略问题,以行为机制理论为基础,根据机器鱼与球之间的距离及机器鱼的方向,通过引入进攻与防守函数来确定各机器鱼的动态角色分...
现有的机器人自适应控制基本上都是在建立机器人线性化的动力学模型的基础上,采用某种显式或隐式参数辨识的方法,在线地修正控制作用.本文针对机器人运动和动力学参数变化的固有特点,提出一种完全不同的自学习自适...
本发明公开了一种基于人工势场与强化学习的机器人路径规划方法,属于路径规划领域。首先,利用使用人工势场法构建地图。其次,在多目标的情况加入小范围强作用力的域势场。最后,利用强化学习与分布课程学习技术,实...
协调运动行为的合成是实现多机器人系统协调运动的关键。本文针对特定环境下的多机器人协调运动问题,基于调速避碰的思想,借助CMAC神经网络,来描述各机器人的运动行为与环境状态之间复杂的、非线性映射关系,利...
This research project is an effort towards achieving robot cooperation to complete a set of tasks. T...
本文作者在研究多机器人协调的基础上,将多机器人作为一个整体,从系统的角度研究多机器人系统的整体行为和组织结构.以人工智能的多自主体系统为理论基础,以网络通讯和分布数据库为技术基础,设计了多机器人分布自...
Существует множество методов решения задач машинного обучения, каждый из которых применяется в зави...
在多机器人系统中 ,评价一个机器人行为的好坏常常依赖于其它机器人的行为 ,此时必须采用组合动作以实现多机器人的协作 ,但采用组合动作的强化学习算法由于学习空间异常庞大而收敛得极慢 .本文提出的新方法通...
对多机器人的体系结构进行了研究 .采用时空表和时间控制器相结合的方法 ,解决多机器人间的协调协作问题 .针对编队问题的具体特性 ,提出了基于环境的记忆学习方法 ,使多机器人编队系统具有较强的环境自适应...
对目前世界上分布式强化学习方法的研究成果加以总结,分析比较了独立强化学习、社会强化学习和群体强化学习三类分布式强化学习方法的特点、差别和适用范围,并对分布式强化学习仍需解决的问题和未来的发展方向进行了...
通过对协作机器人的构型进行分析研究,得出了偏置是影响机器人构型的一个重要因素。首先,对现有典型协作机器人的构型进行分析,通过构型间的内在联系与演化过程得到构型之间的差异。然后利用构型之间的差异引出了偏...
移动边缘计算是解决机器人大计算量任务需求的一种方法;传统算法基于智能算法或凸优化方法,迭代时间长。深度强化学习可以通过一次前向传递即可求解,但只可以针对固定数量机器人进行求解。通过对深度强化学习分析研...
Reinforcement learning has been widely applied to solve a diverse set of learning tasks, from board ...
针对Internet多机器人系统中存在的操作指令延迟、工作效率低、协作能力差等问题,提出了多机器人神经元群网络控制模型。在学习过程中,来自不同功能区域的多类型神经元连接形成动态神经元群集,来描述各机器...
[[abstract]]摘要 本研究引用三種控制法則,配合縱隊、橫隊、鑽石隊型、以及倒V 字型,四 種隊型安排,來探討群組機器人的隊型控制,研究中規劃了四項基本行為及二項 複雜行為來驗証各配對,並在自...
机器鱼水球比赛是进行多机器鱼协作研究的标准平台.考虑在机器鱼水球比赛中的协作顶球策略问题,以行为机制理论为基础,根据机器鱼与球之间的距离及机器鱼的方向,通过引入进攻与防守函数来确定各机器鱼的动态角色分...
现有的机器人自适应控制基本上都是在建立机器人线性化的动力学模型的基础上,采用某种显式或隐式参数辨识的方法,在线地修正控制作用.本文针对机器人运动和动力学参数变化的固有特点,提出一种完全不同的自学习自适...
本发明公开了一种基于人工势场与强化学习的机器人路径规划方法,属于路径规划领域。首先,利用使用人工势场法构建地图。其次,在多目标的情况加入小范围强作用力的域势场。最后,利用强化学习与分布课程学习技术,实...
协调运动行为的合成是实现多机器人系统协调运动的关键。本文针对特定环境下的多机器人协调运动问题,基于调速避碰的思想,借助CMAC神经网络,来描述各机器人的运动行为与环境状态之间复杂的、非线性映射关系,利...
This research project is an effort towards achieving robot cooperation to complete a set of tasks. T...
本文作者在研究多机器人协调的基础上,将多机器人作为一个整体,从系统的角度研究多机器人系统的整体行为和组织结构.以人工智能的多自主体系统为理论基础,以网络通讯和分布数据库为技术基础,设计了多机器人分布自...
Существует множество методов решения задач машинного обучения, каждый из которых применяется в зави...