近日,我室与上海交通大学联合培养的博士研究生马习文以第一作者在IEEE旗下的期刊IEEE Transactions on Cognitive and Developmental System上发表了题为“Multiagent Multiobjective Decision Making and Game for Saving Public Resources”的研究论文,论文通讯作者为我室杨劲松研究员和上海交通大学电子信息与电气工程学院张卫东教授。合作者包括上海交通大学电子信息与电气工程学院张义博博士后、谢威助理教授。
不确定的环境和低效的决策分析限制了集群无人系统对有限公共资源的有效利用,在涉及多目标博弈困境和决策的弱可扩展性的情况下尤为明显。实际作业中,当无人系统数量增多、种类变广时,各无人系统需要连续信息互动,仅依靠人为干预决策工作强度大、成本高。为解决上述问题,本研究提出一个多层博弈模型,集成认知、决策和对策,整合各无人系统的优势,促进有序合作,增强了集群竞争力。此模型为集群无人系统的自主合作提供新思路。
图1. (a)合作-竞争博弈过程中群体对策生成器。(b) 多层博弈模型总体框架。(c)个体的认知和决策模型
本研究基于模糊度量方法,引入最优模糊集、梯形模糊数以及λ-mean方法来量化各无人系统认知和偏好,基于合作博弈中的无环网络和双层Owen值方法将集群无人系统转化为具有通信结构的联盟,进而构建了一个合作-竞争拓扑网络模型,基于此可建立自主认知模型,可解决多目标决策冲突并建立最优策略空间,可确定联盟间和联盟内部的合作与竞争关系以及可找到多智能体多目标非合作博弈的广义延展形式。另外,本研究采用高斯升维方法,设计了一个博弈均衡粒子群优化算法,提高了寻找均衡解的效率,并解决了多目标博弈的非确定性多项式问题,进一步提高了群体多目标博弈模型的收敛性和计算效率。
图2. 各智能体根据个人偏好对其策略空间进行高斯映射(左);合作-竞争网络的拓扑映射(右)
合作-竞争网络的构建可分为三个步骤:1)通过认知模型初步建立个体间的互动;2)建立基于模糊度量的群体和个体优势策略空间;3)通过边际贡献完善互动网络。可见,合作-竞争网络纳入了个体偏好,克服了联盟限制,可反映和解释影响合作关系的关键因素。
图3. 联盟内部和联盟之间非合作博弈的均衡解求解仿真结果
通过对仿真结果的分析可得,基于本研究所提算法的集群无人系统在决策和博弈过程中充分考虑个体偏好和联盟效益,联盟间没有任务冗余,联盟内部无空置现象,证明所提算法成功求出帕累托均衡解。总体而言,本研究节约了公共资源和通信损失,提高了个体决策和博弈的灵活性,并为资源和能力的互补提供了可能性。
本研究得到了国家重点研发计划项目(2022ZD0119903),国家自然科学基金项目(42227901、U2141234、52201369和62203297),上海市科技计划项目(22015810300和19510745200),海南省科技专项基金项目(ZDYF2021GXJS041),浙江省自然科学基金项目(LR21D060002和LGF21D060002),上海帆船项目(22YF1420400),中国博士后科学基金项目(2022M722053),上海交通大学深蓝计划(SL2022PT112和SL2021ZD203),南方海洋科学与工程广东省实验室创新团队项目(311021004)的资助。
论文引用:X.W. Ma,Y.B. Zhang, X. Wei, J.S. Yang*, and W.D. Zhang*, “Multiagent Multiobjective Decision Making and Game for Saving Public Resources”, IEEE Transactions on Cognitive and Developmental Systems, vol. 16, no. 1, pp. 124-140, 2024. 论文链接:Multiagent Multiobjective Decision Making and Game for Saving Public Resources | IEEE Journals & Magazine | IEEE Xplore
© 2021卫星海洋环境动力学国家重点实验室 版权所有.
浙ICP备10040255号-4 流量统计