首页> 中文学位 >中文问答系统中问题分类及答案候选句抽取的研究
【6h】

中文问答系统中问题分类及答案候选句抽取的研究

代理获取

目录

中文问答系统中问题分类及答案候选句抽取的研究

RESEARCH ON QUESTION CLASSIFICATION AND CANDIDATE ANSWER SENTENCES EXTRACTION IN CHINESE QUESTION ANSWERING SYSTEM

摘要

Abstract

第1章 绪论

1.1 课题背景

1.1.1 传统搜索引擎及其弊端

1.1.2 基于目录导航的信息获取

1.1.3 基于FAQ的信息查找

1.1.4 什么是自动问答系统

1.2 国内外相关研究工作

1.2.1 早期的问答系统的研究

1.2.2 国外已有的问答系统

1.2.3 TREC会议及评测

1.2.4 中文问答系统发展现状

1.2.5 问题分类和答案抽取的简介

1.3 本文的主要研究内容

第2章 贝叶斯分类器和支持向量机

2.1 贝叶斯分类器

2.2 统计学习理论

2.3 结构风险最小化

2.4 支持向量机

2.5 本章小结

第3章 中文问题分类

3.1 问题分类简介

3.2 问题分类体系

3.3 基于支持向量机的中文问题分类

3.3.1 汉语依存分析

3.3.2 问题分类的特征选择

3.3.3 利用句法分析提取问题分类的特征

3.3.4 问题分类特征权值计算

3.3.5 命名实体识别

3.3.6 实验结果及分析

3.4 类别主特征结合句法特征的中文问题层次分类

3.4.1 问题类别主特征

3.4.2 基于贝叶斯分类器的中文问题层次分类算法

3.4.3 实验结果及分析

3.5 本章小结

第4章 候选答案句检索

4.1 段落检索与答案句检索

4.2 向量空间模型

4.3 指代消解

4.4 改进的编辑距离计算语义相似度

4.5 实验结果及分析

4.5.1 语料来源

4.5.2 实验方案

4.5.3 实验结果

4.5.4 实验结果分析

4.6 本章小结

第5章 候选答案句确认

5.1 树形结构匹配算法

5.1.1 两个依存树之间的编辑操作

5.1.2 算法简介

5.2 简化的树型结构匹配

5.2.1 先根遍历后改进编辑距离的计算

5.2.2 子树匹配

5.3 试验结果及分析

5.3.1 试验结果

5.3.2 结果分析

5.4 本章小结

结论

参考文献

硕士期间发表的论文

哈尔滨工业大学硕士学位论文原创性声明

哈尔滨工业大学硕士学位论文使用授权书

哈尔滨工业大学硕士学位涉密论文管理

致谢

展开▼

摘要

自动问答系统是集自然语言处理技术和信息检索技术于一身的新一代智能搜索引擎。问答系统包括问题分类、查询扩展、文本检索、答案抽取和答案选择排序,其中,问题分类和答案抽取最为关键。本论文主要利用自然语言处理技术,研究中文问答系统的两个关键技术:问题分类和候选答案句抽取。
  在问答系统中,问题分类作为其第一个重要模块主要有两个作用,第一,问题分类能有效地减少候选答案的空间,提高系统返回答案的准确率。第二,问题分类提供的答案类型信息决定了答案抽取策略。
  本文针对文本分类和问题分类的差别,利用依存分析提取主干和疑问词及其附属成分,并结合主干关联词对,采用支持向量机分类器,此方法大大减少了问题分类的噪音,突出了问题分类的主要特征,并考虑了词与词之间的句法关系,取得了良好效果;同时,针对普通层次分类在问题分类上效果不理想的情况,本文提出了类别主特征结合句法特征的中文问题层次分类新思想,利用句法分析提取分类特征,在问题分类中融入了句法信息,总的准确率达到大类88.25%和小类73.15%,比传统的层次分类分别提高了10个百分点,证明了此方法的有效性。
  候选答案句抽取是问答系统中答案抽取的重要组成部分,其质量直接影响问答系统的性能。针对文本检索和句子检索之间的区别,本文主要采用指代消解预处理,改进的编辑距离与向量空间模型相结合的方法,对factoid问题的答案句检索效果显著,准确率为84.71%。答案句确认主要通过对问句和候选答案句的树形结构匹配,把句子的句法信息融入到候选句的抽取中,在一定程度上克服了简单词袋模型的缺点,并提出简化而有效的树形结构匹配算法——先根遍历后改进编辑距离的新方法,准确率和召回率分别提高了6.2和7.7个百分点。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号