加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于非策略Q学习的多个体优化控制方法

发明专利有效专利
  • 申请号:
    CN201910352788.5
  • IPC分类号:G05B13/04
  • 申请日期:
    2019-04-29
  • 申请人:
    辽宁石油化工大学
著录项信息
专利名称一种基于非策略Q学习的多个体优化控制方法
申请号CN201910352788.5申请日期2019-04-29
法律状态实质审查申报国家中国
公开/公告日2019-08-02公开/公告号CN110083063A
优先权暂无优先权号暂无
主分类号G05B13/04IPC分类号G;0;5;B;1;3;/;0;4查看分类表>
申请人辽宁石油化工大学申请人地址
辽宁省抚顺市望花区丹东路西段一号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人辽宁石油化工大学当前权利人辽宁石油化工大学
发明人李金娜;肖振飞
代理机构沈阳技联专利代理有限公司代理人张志刚
摘要
一种基于非策略Q学习的多个体优化控制方法,涉及一种优化控制方法,本发明针对离散线性非零和博弈问题,提出一种非策略Q学习算法。首先,提出非零和博弈优化问题,并且严格证明根据个体性能指标定义的值函数为线性二次型。然后,基于动态规划和Q学习方法,给出非策略Q学习算法,获得非零和博弈的近似最优解,实现系统的全局纳什均衡。最后算例仿真验证方法的有效性。本发明用于解决线性离散系统的多个体非零和博弈问题,仿真验证了算法的有效性;本发明将博弈理论与非策略学习方法融合,在非零和博弈的框架下,提出非策略学习算法,学习最优控制策略,实现整个系统的全局纳什均衡。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供