中文问答系统中问题分类及答案候选句抽取的研究
RESEARCH ON QUESTION CLASSIFICATION AND CANDIDATE ANSWER SENTENCES EXTRACTION IN CHINESE QUESTION ANSWERING SYSTEM
摘要
Abstract
第1章 绪论
1.1 课题背景
1.1.1 传统搜索引擎及其弊端
1.1.2 基于目录导航的信息获取
1.1.3 基于FAQ的信息查找
1.1.4 什么是自动问答系统
1.2 国内外相关研究工作
1.2.1 早期的问答系统的研究
1.2.2 国外已有的问答系统
1.2.3 TREC会议及评测
1.2.4 中文问答系统发展现状
1.2.5 问题分类和答案抽取的简介
1.3 本文的主要研究内容
第2章 贝叶斯分类器和支持向量机
2.1 贝叶斯分类器
2.2 统计学习理论
2.3 结构风险最小化
2.4 支持向量机
2.5 本章小结
第3章 中文问题分类
3.1 问题分类简介
3.2 问题分类体系
3.3 基于支持向量机的中文问题分类
3.3.1 汉语依存分析
3.3.2 问题分类的特征选择
3.3.3 利用句法分析提取问题分类的特征
3.3.4 问题分类特征权值计算
3.3.5 命名实体识别
3.3.6 实验结果及分析
3.4 类别主特征结合句法特征的中文问题层次分类
3.4.1 问题类别主特征
3.4.2 基于贝叶斯分类器的中文问题层次分类算法
3.4.3 实验结果及分析
3.5 本章小结
第4章 候选答案句检索
4.1 段落检索与答案句检索
4.2 向量空间模型
4.3 指代消解
4.4 改进的编辑距离计算语义相似度
4.5 实验结果及分析
4.5.1 语料来源
4.5.2 实验方案
4.5.3 实验结果
4.5.4 实验结果分析
4.6 本章小结
第5章 候选答案句确认
5.1 树形结构匹配算法
5.1.1 两个依存树之间的编辑操作
5.1.2 算法简介
5.2 简化的树型结构匹配
5.2.1 先根遍历后改进编辑距离的计算
5.2.2 子树匹配
5.3 试验结果及分析
5.3.1 试验结果
5.3.2 结果分析
5.4 本章小结
结论
参考文献
硕士期间发表的论文
哈尔滨工业大学硕士学位论文原创性声明
哈尔滨工业大学硕士学位论文使用授权书
哈尔滨工业大学硕士学位涉密论文管理
致谢