要解决的问题:为了解决垃圾焚烧厂等显示繁琐行为的问题,即使在同一工厂中也表现出不同的行为,并且即使工厂的长期枯竭,行为也会改变。解决方案:使用增强学习方法的植物仿真方法包括以下步骤:将值函数设置为初始状态(S1);使用先前准备的实际工厂运行数据(S2);通过使用先前准备的过程模型对输入的数据操作量进行模型计算来获得状态量(S3);通过使用操作量,状态的计算量和实际工厂操作数据来计算报酬(S4);通过基于针对多个参数计算出的报酬进行强化学习,学习使报酬总额的利润最大化的策略(S5);获取给定状态下的动作所产生的未来预期利润作为价值函数;根据使用值函数获得的学习参数进行仿真。
版权:(C)2004,日本特许厅
公开/公告号JP2004178492A
专利类型
公开/公告日2004-06-24
原文格式PDF
申请/专利权人 MITSUBISHI HEAVY IND LTD;
申请/专利号JP20020346993
申请日2002-11-29
分类号G05B13/04;F23G5/50;G05B13/02;G05B23/02;G06F17/60;G06F19/00;G06N3/00;
国家 JP
入库时间 2022-08-21 23:31:13