首页> 外文期刊>電子情報通信学会論文誌. A, 基礎.境界 >profit Sharingの計算量を改良するアルゴリズムの提案
【24h】

profit Sharingの計算量を改良するアルゴリズムの提案

机译:关于提高利润分配计算量的算法的建议

获取原文
获取原文并翻译 | 示例
           

摘要

強化学習のアルゴリズムの一つに,Profit Sharing(PS)がある.従来のPS(Off-PS)はオフライ ン更新型であり,選択した状態行動対をすべて記憶する必要がある.そのため,ゴールにたどり着くまでの道の りが非常に長く複雑な場合,使用するメモリ量に上限がなくなってしまう欠点がある.それを改善したのが,オ ンライン更新型PS(On-PS)である.このOn-PSでは,従来のOff-PSと等価ながら,メモリ量を有限とする ことができる.しかし,計算時間がOff-PSよりもはるかに大きくなってしまうという問題がある・そこで,本 研究ではOff-PSと等価ながらメモリ量を有限にし,なおかつOn-PSよりも計算時間を大幅に削減する手法を 提案する.また,提案手法の計算量を他の2手法と理論的な比較を行い,更に具体例としてAcrobot Problem に実装することによって,提案手法の有効性を示す.
机译:利益共享(PS)是用于强化学习的算法之一。常规PS(Off-PS)是一种脱机更新类型,必须记住所有选定的状态操作对。因此,如果达到目标的路径非常长且复杂,则存在使用的内存量没有上限的缺点。联机更新类型PS(On-PS)对此进行了改进。使用此On-PS,虽然与传统的Off-PS等效,但内存量可以是有限的。但是,存在运算时间比Off-PS长得多的问题,因此,在本研究中,虽然相当于Off-PS,但是存储量是有限的,与On-PS相比,运算时间大大减少。我们提出一种方法来做到这一点。另外,我们通过理论上比较所提出的方法与其他两种方法的计算复杂度并在Acrobot问题中实现它作为具体示例,来证明所提出方法的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号