融合表示学习与机器学习的专利科学引文标题自动抽取研究

张金柱; 胡一鸣

首页> 中文期刊> 《现代图书情报技术》 >融合表示学习与机器学习的专利科学引文标题自动抽取研究

融合表示学习与机器学习的专利科学引文标题自动抽取研究

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

【目的】针对专利引文类别繁多的问题,研究自动识别其中专利科学引文这一特定类别的方法,进而准确抽取专利科学引文的标题特征项,支撑后续专利科学引文深度分析与挖掘。【方法】引入表示学习方法 Doc2Vec实现专利科学引文整体的语义向量表示,结合机器学习分类方法实现专利科学引文这一特定类别的识别;在此基础上,利用表示学习方法实现专利科学引文标题等内容元数据的语义向量表示,结合机器学习分类方法抽取专利科学引文标题。【结果】在基因领域专利的实验中,专利科学引文的识别精确率达到99.27%,专利科学引文标题抽取精确率达到92.59%,抽取精确率较单纯的机器学习方法提高5.96%。【局限】人工标注训练集较为耗时;对实验数据格式有一定要求。【结论】本文方法在专利科学引文识别和标题抽取上具有良好效果。

著录项

来源
《现代图书情报技术》 |2019年第5期|68-76|共9页
作者
张金柱; 胡一鸣;
展开▼
作者单位

南京理工大学经济管理学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类专利;文献标引与编目;
关键词
专利科学引文; 元数据抽取; 机器学习; 表示学习;

相似文献

中文文献
外文文献
专利

1. 基于机器学习的扫描图书元数据自动抽取研究 [J] . 陈淑平 ,梁东魁 . 现代情报 . 2013,第006期
2. 基于机器学习的专利质量分析与分类预测研究——以区块链技术专利为例 [J] . 符川川 ,陈国华 ,袁勤俭 . 现代情报 . 2021,第007期
3. 基于机器学习算法的引文情感自动识别研究——以自然语言处理领域为例 [J] . 徐琳宏 ,丁堃 ,林原 . 现代情报 . 2020,第001期
4. 基于单层引文网络的技术演进路径研究——以机器学习领域为例 [J] . 张爽 ,刘非凡 ,夏昊翔 . 情报工程 . 2018,第005期
5. 基于单层引文网络的技术演进路径研究——以机器学习领域为例 [J] . 张爽 ,刘非凡 ,夏昊翔 . 情报工程 . 2018,第005期
6. 机器学习中的知识压缩表示及并行强构造学习算法 [C] . 武继刚 ,刘洁 ,陈国良 . 第六届全国机器学习研讨会 . 1998
7. 基于表示学习的专利科学引文元数据自动抽取及其内容挖掘研究 [A] . 胡一鸣 . 2018

融合表示学习与机器学习的专利科学引文标题自动抽取研究

摘要

著录项

相似文献

相关主题

期刊订阅