不完全信息下基于合作-竞争拓扑网络的群体决策

供稿:马习文 发布日期:2025-05-13 阅读:337

近日,我室与上海交通大学联合培养的博士研究生马习文以第一作者在IEEE旗下的TOP期刊IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS: SYSTEMS上发表了题为“Co-Opetition Network-Based Group Decision-Making Under Incomplete Information”的研究论文,论文通讯作者为我室杨劲松研究员。合作者包括上海交通大学自动化与感知学院胡志焕博士后、谢威副教授、张卫东教授,北京科技大学段凯蓉助理教授,中科院自动化研究所艾晓琳副研究员。

在博弈论中,合作与竞争策略的融合以策略空间与群体互动的系统性为核心,构成双赢博弈的理论基础。这一特性在联盟约束与信息不完全的决策情境中尤为关键。本研究构建基于竞合拓扑网络(COTN)的策略形成综合性数学方法:通过刻画不完全信息与联盟约束下的个体偏好,实现群体决策中自主决策行为与博弈均衡状态的协同建模。本研究基于优劣互补熵与模糊测度理论,构建信息交互与属性融合的认知模型;借助有序加权平均算子与平均树解,实现最优联盟结构的定量识别;通过缺失信息评估机制动态优化节点连接权重,完善拓扑网络的结构表示;结合认知模型与价值函数动态更新,设计高斯振荡启发式算法(GOH),探索联盟与组件策略空间的多维度解。

1.png

图1. (a) 对策生成器。(b) 群体决策框架。(c) 竞合拓扑网络模型。

本研究针对不完全信息与联盟约束下的群体决策问题,设计平均互联互补算法(AIC),通过主体互动关系推断未知信息以完善拓扑网络结构;通过迭代更新认知矩阵与价值函数,动态调整个体及联盟策略空间,高效搜索博弈纳什均衡以应对多目标冲突与计算复杂度。

2.png

图2.  COTN初始化结构

3.png

图3. 权重集成后COTN局部拓扑结构

多智能体协作目标检测的仿真实验验证了模型有效性:主体通过自主联盟形成、缺失信息补全及 GOH 算法均衡策略搜索,实现群体收益显著优于个体独立决策。与 MADDPG、传统群决策模型等现有方法相比,该方法在动态竞合环境中具备更强适应性,可有效处理不完全信息与联盟约束问题,为机器人协作、供应链管理等领域提供可扩展的决策框架。

4.png

图4. 群体协作检测目标

5.jpg

图5. 缺失信息评估的迭代收敛过程

本研究得到了国家重点研发计划项目(2022ZD0119900),国家自然科学基金项目(U2141234、U24A20260、42227901),上海市科技计划项目(22015810300和19510745200),海南省科技专项基金项目(ZDYF2024GXJS003),上海交通大学深蓝计划(SL2021ZD203),南方海洋科学与工程广东省实验室创新团队项目(311021004)的资助。

论文引用:X. W. Ma, Z. H. Hu, K. R. Duan, X. L. Ai, W. Xie, J. S. Yang, W. D. Zhang. Co-opetition NetworkBased Group Decision-Making under Incomplete Information[J]. IEEE Trans. Syst. Man Cybern. Syst., 55(5), 3464-3479, 2025. ieeexplore.ieee.org/document/10915723


  • 卫星海洋环境监测预警全国重点实验室

    © 2021卫星海洋环境监测预警全国重点实验室 版权所有.
    浙ICP备10040255号-4   流量统计   

  • 地址:杭州市保俶北路36号
    邮编:310012
  • 总机号码:+86-571-8196 3198
    传真:+86-571-8883 9374