实体关系抽取
实体关系抽取的相关文献在2004年到2023年内共计390篇,主要集中在自动化技术、计算机技术、信息与知识传播、轻工业、手工业
等领域,其中期刊论文113篇、会议论文6篇、专利文献40144篇;相关期刊77种,包括现代图书情报技术、农业机械学报、哈尔滨工程大学学报等;
相关会议6种,包括第九届全国计算语言学学术会议、第十六届中国神经网络大会(CNNC2006)暨首届中国人工免疫系统专题会议(CAISC06)、全国第八届计算语言学联合学术会议等;实体关系抽取的相关文献由1117位作者贡献,包括孙媛、陈曦、刘知远等。
实体关系抽取—发文量
专利文献>
论文:40144篇
占比:99.70%
总计:40263篇
实体关系抽取
-研究学者
- 孙媛
- 陈曦
- 刘知远
- 孙茂松
- 左敏
- 李子茂
- 林衍凯
- 不公告发明人
- 余正涛
- 向阳
- 尹帆
- 张青川
- 李建强
- 李直旭
- 杨静
- 覃俊
- 关毅
- 刘晶
- 刘杰
- 吴刚
- 周国栋
- 张扬
- 张瑾
- 张素香
- 徐硕
- 文娟
- 文瑞
- 曾道建
- 李健
- 李涛
- 李蔚栋
- 杜军威
- 杜坤钰
- 段鹏飞
- 毛养勤
- 汪颢懿
- 滕飞
- 熊盛武
- 王勇
- 王安然
- 王政
- 石川
- 秦颖
- 程学旗
- 线岩团
- 耿昊天
- 葛艳
- 袁彩霞
- 许文波
- 贾海涛
-
-
陈仁杰;
郑小盈;
祝永新
-
-
摘要:
针对实体关系抽取任务中的三元组重叠问题,基于编码器-解码器结构的联合抽取方法能够通过序列生成的方式加以解决。但现有方法没有充分利用实体类别信息,而实体类别信息对于构建更丰富的语义特征并进一步优化关系模型的效果具有重要意义。在使用编码器-解码器结构的基础上,融合实体类别信息构建实体关系联合抽取模型FETI。编码器采用经典Bi-LSTM结构,解码器采用树状解码替代传统的一维线性解码。同时,在解码阶段增加头尾实体类别的预测,并通过辅助损失函数进行约束,使模型能够更有效地利用实体类别信息。在百度公开的中文数据集DuIE上进行实验,结果表明,FETI的F1值达到0.758,相对于CopyMTL、WDec、MHS、Seq2UMTree模型提升了2.02%~9.86%,验证了融合实体类别信息对于提升实体关系抽取模型性能的有效性。此外,基于不同解码顺序和不同权重损失函数的实验结果表明,解码顺序对模型性能影响较大,而对主要任务的损失函数赋予较高权重,能够保证辅助任务为主要任务提供有效的背景知识,同时限制噪声的影响。
-
-
王莉
-
-
摘要:
在信息技术快速发展的时代,数据已成为重要的生产要素,大数据上升为国家战略。本期本栏目专门刊发了由中国计算机学会CCF主办,CCF大数据专家委员会和中山大学联合承办的第九次全国大数据学术会议推荐的5篇优秀论文,内容涵盖了电力数据挖掘,智慧司法,医学图像分类,推荐系统,实体关系抽取等各方面的内容。反映了当前大数据在各行业的广泛应用,相关成果将为研究人员带来启发。
-
-
代建华;
彭若瑶;
许路;
蒋超;
曾道建;
李扬定
-
-
摘要:
信息抽取任务旨在从非结构化的文本中抽取出结构化的信息,帮助将海量信息进行自动分类、提取和重构,提高信息的利用率.目前,基于深度神经网络的信息抽取技术已经成为自然语言处理领域最重要的研究主题之一,它提供了分析非结构化文本的有效手段,是实现大数据资源化、知识化和普适化的核心技术,此外进一步为更高层面的应用和任务提供了支撑.文章对基于深度神经网络的信息抽取相关研究进行了综述,首先,简要概述了信息抽取的任务定义、目标和意义,然后,回顾了信息抽取任务的发展历程,接下来,从实体抽取、实体关系抽取、事件抽取和事件关系抽取4个方面梳理了近几年关键技术的研究进展.最后,文章对信息抽取领域的未来发展趋势进行了分析和展望.
-
-
陆亮;
孔芳
-
-
摘要:
实体关系抽取旨在从文本中抽取出实体之间的语义关系。该任务在新闻报道、维基百科等规范文本上的研究相对丰富,并取得了一定的成果,但面向对话文本的相关研究还处于起始阶段。目前用于实体关系抽取的对话语料规模较小且信息密度低,有效特征难以捕获;深度学习模型无法像人一样进行知识联想,单纯依靠加大标注数据量和增强计算力难以精细深度地理解对话内容。针对上述问题,提出了一个融入知识的实体关系抽取模型,使用Star-Transformer从对话文本中有效捕获特征,同时通过关键词共现的方式构建一个包含关系及其语义关键词的关系集合,将该集合与对话文本进行相关性计算后得到的重要关系特征作为知识融入模型中。在DialogRE公开数据集上进行实验,得到F_(1)值为53.6%,F_(1c)值为49.5%,证明了所提方法的有效性。
-
-
袁清波;
杜晓明;
马合林
-
-
摘要:
针对军事指挥控制保障领域各种技术数据资料挖掘处理和融合应用效率低下的问题,提出利用知识抽取技术获取关键知识及其相互关系,形成相应知识体系,以实现数据的高效利用。在知识抽取系统框架的研究与设计过程中,首先介绍了知识抽取的相关理论知识,如知识图谱、命名实体识别、关系抽取等技术;其次分析了军事领域知识抽取中命名实体识别和关系抽取的研究现状;最后设计了指挥控制保障领域知识抽取系统的总体框架和模块,包括本体建模、语料标注、命名实体识别和关系抽取等模块。首次对指挥控制保障领域的知识抽取进行研究,在系统设计过程中充分考虑了部队的实际情况,具有较强的实用性和针对性,可以为指挥控制保障领域知识图谱的后续构建提供理论指导和技术支撑。
-
-
潘理虎;
陈亭亭;
闫慧敏;
赵彭彭;
张睿;
张英俊
-
-
摘要:
实体关系抽取是构建知识图谱过程中至关重要的一步。将注意力机制引入卷积神经网络或循环神经网络是目前关系抽取任务中比较主流的解决方法,谷歌最新提出的BERT模型在多项自然语言处理任务中都取得了非常好的效果。为了充分融合局部信息和全局信息,并提高处理效率,该文提出了滑动窗口注意力网络模型(Sliding Window Attention Network,SWAN)。该模型首先通过预训练的word2vec生成词向量,加入位置表示并使用TransE模型对实体进行表征以充分突出实体信息,再采用基于BERT的SBERT模型对句子进行表征,在此基础上采用多种滑动窗口注意力机制捕获局部信息,然后在聚集层对抽取到的局部信息进行聚合,最后利用softmax函数来实现实体关系的分类。实验结果表明,提出的SWAN模型在SemEval2010 Task 8数据集上取得了较高的准确率,优于对比的现有关系抽取模型,同时模型训练效率也得到极大提升。
-
-
蒋伟强;
李凤英;
董荣胜
-
-
摘要:
针对实体关系联合抽取任务中的重叠实体关系识别问题,提出了一种混合神经网络模型(MNN-RE)。MNN-RE使用膨胀卷积神经网络结合门控线性单元作为输入共享编码层,增强了实体与关系之间关联度。采用自注意力机制结合指针网络的标注策略提取主实体。基于贪心策略,对每个预定义的关系都进行关系存在的预测并抽取目标实体,以此得到完整三元组。实验结果表明,该模型在中文的实体与关系联合抽取任务的表现比经典的联合抽取模型Noveltagging及Multi-head模型要好。
-
-
殷纤慧;
古丽拉·阿东别克
-
-
摘要:
针对关系抽取任务中文本特征提取不充分及核心词表现弱的问题,提出了一种多特征注意力卷积神经网络的实体关系抽取方法.利用位置、词性及实体标签作为输入特征,充分捕获文本信息,构建注意力模型,获得单词与目标实体之间的相关性,并将注意力机制与卷积神经网络相融合以进行关系预测.以新疆旅游领域为研究对象,总结归纳15种实体关系.采用自行开发设计的语料标注系统,建立了新疆旅游领域小型语料关系库.实验结果表明,本文模型对于提高实体关系抽取的正确率有显著效果.
-
-
杨超男;
彭敦陆
-
-
摘要:
文档的内部语义依赖和逻辑结构远远比句子的复杂,传统的实体关系抽取模型未能充分考虑文档中的多个不连续句子间差异化的关系,导致文档级实体关系抽取任务中模型抽取的关系特征不精确.为此,提出融合双向简单循环网络与胶囊网络的文档级实体关系抽取模型.双向简单循环网络实现多个句子间关系融合表示,同时优化对时间步的依赖,提高并行化效率;胶囊网络优化学习实体关系在空间、方向等多个维度上的关系表示.实验结果表明,本文所提出的融合模型在文档级实体关系抽取任务中具有良好表现.
-
-
李子茂;
张玥;
尹帆;
郑禄;
白鑫
-
-
摘要:
远程监督通过已有知识库的关系三元组和自然语言文本语料库进行启发式匹配,获得数据来完成关系抽取任务,解决有监督学习方法完全依赖人工标注数据的问题,但远程监督数据中会存在大量噪声关系标签.针对以上问题,提出了一种结合自注意力机制和分段卷积神经网络的实体关系抽取模型SAPCNN,首先通过自注意力机制捕获词与词之间的全局相关性,解决在对语料句子进行卷积操作时仅关注当前窗口内容的问题;然后将包含相同实体对的语句划分为一个包,利用多实例学习和包内注意力机制计算包中每个句子的注意力权重,从而找到更能表达实体对之间语义关系的句子语料.实验结果显示:SAPCNN能提高实体关系抽取的精确率,结果优于主流算法.
-
-
-
Tianci Xia;
夏天赐;
Yuan Sun;
孙媛
- 《第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会(CCL 2018)》
| 2018年
-
摘要:
从无结构文本中抽取实体与实体之间的关系是自然语言处理领域的重要研究内容,同时也为构建知识图谱、问答系统等应用提供重要支撑.基于联合模型的实体关系抽取任务将实体识别和关系抽取同时进行,克服了传统实体关系抽取任务中先识别句子中的实体,然后在进行实体关系判断这两次任务中的错误累加.该文针对藏文语料匮乏,实体识别准确率不高等问题,提出了基于联合模型抽取藏文实体关系的方法.该文基于藏文实体关系抽取任务,提出以下方案:针对藏文分词准确率不高的问题,对藏文进行字级和词级两种方式进行预处理,并给出对比实验,结果表明采用字级处理方式较词级处理方式效果有所提高.藏语是一种语法规则比较强的语言,名词、格助词等能明确指示句子各组块之间的语法和语义结构关系,因此该文将藏文的词性标注特征加入到藏文的字词向量中,实验结果表明方法的有效性.该文借鉴了联合模型处理的优势,提出基于联合模型处理方式,采用端到端的BiLSTM框架将藏文实体关系抽取任务转变为藏文序列标注的问题,实验结果表明,该文的方法较传统的基于藏文处理方式如SVM算法和LR算法,准确率提高了30%-40%.
-
-
徐芬;
王挺;
陈火旺
- 《第九届全国计算语言学学术会议》
| 2007年
-
摘要:
实体关系抽取是很多自然语言处理任务的重要基础。本文针对中文中实体关系的特点,设计了一系列的特征。包括词、词性标注、实体和出现信息、包含关系和知网提供的概念信息等,以构成实体间关系的上下文特征向量并使用SVM方法进行了中文实体关系抽取。以ACE2004的训练语料作为实验数据,得到了较好的识别性能。同时根据分级实验的结果,考察了各种特征集对识别性能的影响,得到下一步研究的方向。
-
-
王浩畅;
赵铁军;
于浩
- 《全国第八届计算语言学联合学术会议》
| 2005年
-
摘要:
随着基因和蛋白质序列的发布和分子生物学研究的发展,其相关的数据呈指数级增长.因此如何从海量的相关文献中直接获取生物学家研究领域的相关信息变得迫在眉睫.我们的研究主要致力于两方面的内容:一个是命名实体的识别,另一个是实体关系抽取.研究方法主要有:基于特征向量的机器学习方法、基于规则的方法和基于统计的方法,我们在蛋白质名称的识别上取得了较好的结果.
-
-
车万翔;
刘挺;
李生
- 《第一届全国信息检索与内容安全学术会议》
| 2004年
-
摘要:
实体关系抽取是信息抽取研究领域中的重要研究课题.本文使用两种基于特征向量的机器学习算法,Winnow和支持向量机(SVM),在2004年ACE(Automatic Content Extraction)评测的训练数据上进行实体关系抽取实验.两种算法都进行适当的特征选择,当选择每个实体的左右两个词为特征时,达到最好的抽取效果,Winnow和SVM算法的加权平均F-Score分别为73.08﹪和73.27﹪.可见在使用相同的特征向量,不同的学习算法进行实体关系的识别时,最终性能差别不大.因此使用自动的方法进行实体关系抽取时,应当集中精力寻找好的特征.
-
-
-
-
-