dynamic treatment regime; reinforcement learning; sequential randomization; nonregularity; Q-learning;
机译:诊断肿瘤临床试验中随后治疗的敏感性分析:两阶段随机动态治理方案方法
机译:针对顺序治疗决策的最佳动态治疗方案的可靠估计
机译:序列分批反应器中尿液的硝化和厌氧氨处理的状态变化和微生物动力学
机译:设计最佳动态治疗制度:一种因果加固学习方法
机译:用于评估动态治疗制度和最优剂量的新统计学习方法
机译:动态制度边际结构均值模型用于估计最佳动态治疗制度第二部分:结果证明
机译:动态方案边缘结构均值模型,用于估计最佳动态治疗方案,第一部分:主要内容