首页> 中文学位 >口语对话系统中的对话行为识别研究
【6h】

口语对话系统中的对话行为识别研究

代理获取

目录

声明

1绪论

1.1研究背景及意义

1.2国内外研究现状

1.3研究内容与主要工作

1.4论文组织结构

2中文口语对话系统的对话行为识别

2.1口语对话系统

2.2对话行为

2.3 ID和OOD话语分离识别的口语语言理解

3 ID对话行为识别

3.1特征工程

3.2序列模型

3.3实验

4 OOD对话行为识别

4.1相关算法

4.2 CNN-RF混合模型

4.3实验

5总结与展望

5.1总结

5.2展望

致谢

参考文献

附录

展开▼

摘要

面向任务(task-oriented)的限定领域(restricted domain)口语对话系统(spoken dialogue system,SDS)因专于某一特定的任务,能帮助人们完成更多的问题和工作,比开放领域的聊天机器人更有研究和应用价值。对话行为(dialogue act,DA)识别是处理用户话语的关键环节,是后续对话控制和应答的基础。在研究进展中,DA识别通常被当作短文本分类问题,但口语对话系统话语通常具有的噪音多、特征稀疏和主题不明确等特点,DA识别仍然存在许多挑战。
  根据用户话语是否携带领域语义信息,本文将其分为领域内(in domain,ID)话语和领域外(out of domain,OOD)话语,并在手机导购领域口语对话系统的对话语料中验证了ID和OOD话语分别单独进行DA识别的方法,能有效地提升口语对话系统的总体DA识别准确率,从而确定了ID和OOD话语分离进行DA识别优化研究的方案。
  在ID话语的DA识别上,综合使用多种词汇、语法、语义等特征,并利用长短期记忆人工神经网络(long-short term memory,LSTM)的序列性刻画对话历史等上下文信息,使得对话行为识别从单句扩展到语境中的理解。而在OOD话语的DA识别方面,考虑到卷积神经网络(convolutional neural network,CNN)在特征表达方面的优势以及随机森林(random forest,RF)模型良好的泛化能力,本文提出一种CNN-RF混合模型的OOD话语DA识别方法,综合了基于CNN的局部特征提取器和基于随机森林模型的DA分类器。
  本文的实验数据来自于所在研究室实现的中文手机导购口语对话系统。DA类别是以国际标准化组织拟订的新对话行为标注体系(ISO24617-22012)为基础,参考SWBD-DAMSL对话行为标注拟定的,包括5种ID话语DA和25种OOD话语DA。各种DA识别模型通过交叉验证的方式进行了参数选择。实验表明,本文提出的ID和OOD话语的DA方法均取得了优于研究进展方法的效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号