声明
第1章 绪论
1.1 研究内容与研究意义
1.2 知识图谱补全研究现状
1.3 本文工作概述
1.4 本文章节安排
第2章 相关工作
2.1 强化学习
2.2 蒙特卡洛树搜索
2.3 序列建模
第3章 知识图谱补全问题定义
3.1 问题描述
3.2 知识图谱补全的马尔科夫过程定义
第4章 深度智能体网络结构
4.1 实体邻接信息编码与全动作空间
4.2 时域卷积状态编码层
4.3 策略决策层网络
第5章 环境探索和智能体训练预测
5.1 结合策略探索的信任度上限树算法
5.2 模型训练
5.3 模型预测
第6章 实验结果
6.1 数据集和评估方法
6.2 实验细节和参数设置
6.3 实验结果
6.3.1 Policy-UCT算法效果
6.3.2 任务实验结果
6.4 结果的可解释性分析
第7章 总结与展望
参考文献
作者简介
致谢
吉林大学;