基于混合内容线索特征的语义组块标注研究

白如江; 冷伏海; 廖君华

首页> 中文期刊> 《情报学报》 >基于混合内容线索特征的语义组块标注研究

基于混合内容线索特征的语义组块标注研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

In the big data era,how to improve the semantic understanding for the academic papers is one of the hot topics in intelligence research.This paper using word frequency statistics and co-word analysis method to analyze the shallow grammatical features,context feature and the core clue word feature of the academic content.We construct a mixed content clue character set,and using conditional random field model to annotate the semantic chunk.The NSF research of carbon nanotubes project data was taken as experiment dataset.Results show that the precision value of B-SUB,I-SUB,B-ACT,I-ACT,B-GOL,I-GOL,B-IMP7 is 84.43％,89.09％,84.38％,89.87％,51.33％,50.37％,37.83％,respectively,compared to the precision of content clue features non-added,the value improved significantly.In particular,B-SUB,I-SUB,B-ACT,I-ACT four tags,the increase in the content of the characteristics of the clues to enhance the accuracy of the value of more than 10％.%大数据时代背景下,实现科技文献深层语义理解逐渐成为情报学研究的热点话题,本文利用词频统计和共词分析方法分析了科技文献内容浅层语法特征、上下文特征和核心线索词特征,构建了混合内容线索特征集合,采用条件随机场模型,对NSF碳纳米管研究领域项目数据进行了语义组块标注实验.实验结果表明,在B-SUB、I-SUB、B-ACT、I-ACT、B-GOL、I-GOL、B-IMP7种标签标注中,增加混合内容线索特征后的精度值分别达到84.43％、89.09％、84.38％、89.87％、51.33％、50.37％、37.83％,与没有增加的标注结果相比精度值有了明显提升.特别是B-SUB、I-SUB、B-ACT、I-ACT四种标签,在增加了内容线索特征后精度值提升了10％以上.

著录项

来源
《情报学报》 |2017年第4期|382-391|共10页
作者
白如江; 冷伏海; 廖君华;
展开▼
作者单位

山东理工大学科技信息研究所;

淄博255049;

中国科学院科技战略咨询研究院;

北京 100190;

山东理工大学科技信息研究所;

淄博255049;

展开▼
原文格式 PDF
正文语种 chi
中图分类
关键词
内容线索特征; 条件随机场; 语义组块标注;

相似文献

中文文献
外文文献
专利

1. 基于语义组块分析的汉语语义角色标注 [J] . 丁伟伟 ,常宝宝 . 中文信息学报 . 2009,第005期
2. 基于组块分析的路径自然语言语义角色标注方法 [J] . 张秀龙 ,李新德 ,戴先中 . 东南大学学报（自然科学版） . 2012,第0z1期
3. 基于组块分析的路径自然语言语义角色标注方法 [J] . 张秀龙 ,李新德 ,戴先中 . 东南大学学报：自然科学版 . 2012,第A01期
4. 基于词汇语义特征的中文语义角色标注研究 [J] . 邵艳秋 ,穗志方 ,吴云芳 . 中文信息学报 . 2009,第006期
5. 基于条件随机场的多线索中文语义角色标注 [J] . 王一成 ,万福成 ,马宁 . 云南大学学报：自然科学版 . 2020,第3期
6. 基于语义的视频内容标注方法研究 [C] . 孙中华 ,贾克斌 . 中国自动化学会智能建筑与楼宇自动化专业委员会2018年年会 . -1
7. 基于序列标注的中文语义组块分析系统设计与实现 [A] . 夏文静 . 2019

基于混合内容线索特征的语义组块标注研究

摘要

著录项

相似文献

相关主题

期刊订阅