基于SciBERT模型的引文上下文识别系统优化

郭晨睿; 王佳敏; 崔浩冉; 武健

首页> 中文期刊> 《情报工程》 >基于SciBERT模型的引文上下文识别系统优化

基于SciBERT模型的引文上下文识别系统优化

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

[目的/意义]本文介绍一个用于从英文学术文献中提取显性引文句和隐性引文上下文的系统。该系统基于SmartCiteCon(SCC)系统对识别模型进行了优化,本文称该系统为SmartCiteCon2.0(SCC2.0)。[方法/过程]该系统的识别模型部分通过Python语言编写,基于经过微调的SciBERT模型构建而成。该模型基于国际计算语言学协会(ACL)会议论文集中人工标注的27,832个引用上下文句子对进行训练,并以SCC系统使用的SVM模型作为对照组以验证效果。[结果/结论]实验结果表明,微调后的SciBERT模型的F1值为90%。相比仅使用句子对文本特征的SVM模型F1值提升了11%,相比于使用全部特征SVM模型的F1提升了3%。在该模型基础上,本文构建的SCC2.0系统开箱即用,支持PDF,以及符合特定标准的XML和JSON格式的学术文献。该API同时支持单文档处理和多文档并发处理,源代码发布于https://gitee.com/Lan_Tianchen/smart-cite-con。

著录项

来源
《情报工程》 |2021年第5期|3-14|共12页
作者
郭晨睿; 王佳敏; 崔浩冉; 武健;
展开▼
作者单位

武汉大学信息管理学院;

武汉430072;

欧道明大学计算机科学系;

诺福克23529;

展开▼
原文格式 PDF
正文语种 chi
中图分类情报学、情报工作;
关键词
引文识别; 隐性引文上下文; SciBERT; 引文识别系统;

相似文献

中文文献
外文文献
专利

1. 基于空间位置关系改进的物体识别上下文模型 [J] . 李宏伟 ,徐晓滨 ,文成林 . 杭州电子科技大学学报 . 2013,第006期
2. 汉语语音识别声调模型集成中基于决策树的上下文相关权重参数聚类方法 [J] . 黄浩 ,李兵虎 ,吾守尔·斯拉木 . 新疆大学学报（自然科学版） . 2011,第003期
3. 基于嵌入式生物特征识别的用户上下文服务模型 [J] . 王厦 ,朱宏 ,康艳 . 微计算机信息 . 2009,第032期
4. 基于上下文相似度的对象识别模型的研究 [J] . 高迎 ,程涛远 . 计算机工程与应用 . 2008,第023期
5. 基于上下文三音素DBN模型的连续语音识别 [J] . 吕国云 ,赵荣椿 ,蒋冬梅 . 计算机工程与应用 . 2007,第035期
6. 基于引文上下文的学术文本自动摘要技术研究 [C] . Huang Yong ,黄永 ,Chen Haihua . 第十三届海峡两岸图书资讯学学术研讨会 . -1
7. 基于引文上下文分析的文献检索技术研究 [A] . 张金松 . 2013

基于SciBERT模型的引文上下文识别系统优化

摘要

著录项

相似文献

相关主题

期刊订阅