首页> 中文会议>第十八届中国计算语言学大会暨中国中文信息学会2019学术年会 >中文矛盾语块数据集构建和边界识别研究

中文矛盾语块数据集构建和边界识别研究

页面导航

摘要
著录项
相似文献
相关主题

摘要

正确理解文本矛盾是自然语言理解的一项基础性问题.目前的研究大多针对矛盾识别任务,深入文本内部探究矛盾产生原因的工作较少,且缺乏专门的中文矛盾数据集.该文在前人矛盾研究基础上,提出矛盾语块的概念,将其划分为7种类型,并根据标注规范构建了包含16,224条数据的中文矛盾语块(CCB)数据集.基于此数据集,利用序列标注及抽取式阅读理解类模型开展矛盾语块边界识别实验,以检验模型对矛盾内部语义信息的理解能力,结果显示阅读理解类模型在该任务上的性能优于序列标注模型.该文通过三个角度对影响语块边界识别的因素进行分析,为文本矛盾后续研究工作提供可靠的数据集和基线模型.

著录项

来源
《第十八届中国计算语言学大会暨中国中文信息学会2019学术年会》|2018年|1-11|共11页
会议地点北京
作者
LI Bohan; 李博涵; JIANG Shan; 姜姗; LIU Chang; 刘畅; DONG Yu; 于东;
展开▼
作者单位

教育部华中师范大学;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类文字信息处理;
关键词
中文解析; 矛盾语块; 数据集; 边界识别;

相似文献

中文文献
外文文献
专利

1. 中文矛盾语块数据集构建和边界识别研究 [J] . 李博涵 ,姜姗 ,刘畅 . 中文信息学报 . 2020,第003期
2. 中文句法异构蕴含语块标注和边界识别研究 [J] . 金天华 ,姜姗 ,于东 . 中文信息学报 . 2019,第002期
3. 中文文本蕴含类型及语块识别方法研究 [J] . 于东 ,金天华 ,谢婉莹 . 软件学报 . 2020,第012期
4. 非英语专业学生在阅读中识别二语语块的研究 [J] . 郑霞娟 . 北华大学学报（社会科学版） . 2013,第006期
5. 多目标情感分类中文数据集构建及分析研究 [J] . 刘鹏远 ,田永胜 ,杜成玉 . 中文信息学报 . 2021,第006期
6. 中文句法异构蕴含语块标注和边界识别研究 [C] . Jin Tianhua ,金天华 ,Jiang Shan . 第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会（CCL 2018） . 2018
7. 基于语块的汉语韵律短语边界识别研究 [A] . 冯志茹 . 2015

中文矛盾语块数据集构建和边界识别研究

摘要

著录项

相似文献

相关主题

期刊订阅