Markov processes; decision theory; dynamic programming; information theory; learning (artificial intelligence); Markov decision process; continuous-state MDPs; divergence-to-go; dynamic programming; exploration method; information-theoretic estimators; model based approach; reinforcement learning; sequential decision problem; Computational modeling; Kernel; Learning (artificial intelligence); Markov processes; Measurement uncertainty; Monte Carlo methods; Uncertainty;
机译:基于概率框架的对话系统的情感对话建模的可操作混合Ddn-pomdp方法
机译:基于MDP模型的强化学习平台用于生产站升级优化:Q学习分析
机译:基于POMDP的辅助系统的知识工程的关系方法,是一种心理模型的翻译
机译:基于模型的探讨探索连续状态MDPS使用发散 - 去
机译:基于POMDP的对话管理的机器学习意图发现的改进方法
机译:利用基于LC-MS基代代谢组和分子建模支持的OSMAC方法的一些红海衍生放放放放线菌的化学多样性和抗糖蛋白酶探讨
机译:基于概率框架的对话系统的情感对话建模的易处理的混合DDN-POMDP方法
机译:使用基于模型的系统工程方法探索医疗系统开发。