事件抽取
事件抽取的相关文献在2006年到2023年内共计419篇,主要集中在自动化技术、计算机技术、科学、科学研究、信息与知识传播
等领域,其中期刊论文134篇、会议论文8篇、专利文献28799篇;相关期刊74种,包括情报理论与实践、情报杂志、现代图书情报技术等;
相关会议7种,包括第25届全国计算机信息管理学术研讨会、第十一届全国计算语言学学术会议、第五届全国青年计算语言学研讨会(YWCL 2010)等;事件抽取的相关文献由1189位作者贡献,包括朱巧明、李培峰、刘挺等。
事件抽取—发文量
专利文献>
论文:28799篇
占比:99.51%
总计:28941篇
事件抽取
-研究学者
- 朱巧明
- 李培峰
- 刘挺
- 秦兵
- 吴飞
- 李倩
- 毛乾任
- 黄洪仁
- 李建欣
- 漆桂林
- 王玉杰
- 丁效
- 傅晓航
- 孙涛
- 孙睿
- 常宏宇
- 张正义
- 徐猛
- 方四安
- 李法远
- 林方
- 陈玉光
- 代旭东
- 叶俊鹏
- 司靖辉
- 吴刚
- 周国栋
- 周昊
- 姚建民
- 崔现鹏
- 庄越挺
- 李弼程
- 李心雨
- 杨海钦
- 杨风雷
- 汪海燕
- 洪宇
- 潘禄
- 王雷
- 王鹏尧
- 赵东岩
- 黎建辉
- 万常选
- 万齐智
- 乔林波
- 付骁弈
- 刘德喜
- 刘阳
- 卢奕南
- 姜明
-
-
缪峰;
王萍;
李太勇
-
-
摘要:
抽取事件之间的因果关系能够应用于自动问答、知识提取、常识推理等方面。隐式因果关系由于缺乏明显的词汇特征和中文复杂的句法结构,使得其抽取极为困难,已成为当前研究的难点。相比而言,显示因果关系的抽取比较容易、准确率高,且因果关系事件之间的逻辑关系稳定。为此,文中提出了一种原创的方法,首先通过对抽取的显示因果事件对进行事件动作的归一化处理后形成事件方向,然后对事件主体进行泛化处理,最终形成标准的匹配因果事件对集合。利用此集合根据事件相似度从语句中抽取隐式因果事件对。为了识别更多的隐式因果关系,文中同时提出了一种因果连接词发现算法。在网易财经、腾讯财经和新浪财经上爬取的实验数据验证,对事件动作进行归一化处理后形成事件方向相比传统方法抽取准确率提高了1.02%。
-
-
李志鹏;
高振远;
周阳;
马政;
胡志强;
石珺;
易勇
-
-
摘要:
恐怖事件、暴动事件、突发事件等社会事件对国家安全造成了极大的威胁,也给社会治理带来了新的挑战。事件库通过记录社会现实事件,能够在态势感知、风险预警、应急响应等社会安全应用中发挥重要作用。构建全球事件库的两个开创性项目ICEWS和GDELT最近获得了广泛关注,文中对这两个全球事件库进行了系统的分析、对比和评估,以期为事件库构建、事件抽取和事件图谱等领域提供帮助和参考。
-
-
代建华;
彭若瑶;
许路;
蒋超;
曾道建;
李扬定
-
-
摘要:
信息抽取任务旨在从非结构化的文本中抽取出结构化的信息,帮助将海量信息进行自动分类、提取和重构,提高信息的利用率.目前,基于深度神经网络的信息抽取技术已经成为自然语言处理领域最重要的研究主题之一,它提供了分析非结构化文本的有效手段,是实现大数据资源化、知识化和普适化的核心技术,此外进一步为更高层面的应用和任务提供了支撑.文章对基于深度神经网络的信息抽取相关研究进行了综述,首先,简要概述了信息抽取的任务定义、目标和意义,然后,回顾了信息抽取任务的发展历程,接下来,从实体抽取、实体关系抽取、事件抽取和事件关系抽取4个方面梳理了近几年关键技术的研究进展.最后,文章对信息抽取领域的未来发展趋势进行了分析和展望.
-
-
韩娜;
张昊洋
-
-
摘要:
针对现有事件抽取模型事件数据集规模较小、存在开销与性能不平衡问题,采用ALBERT预训练语言模型生成词向量,将其输入BiLSTM+CRF模型完成句子级事件的特征向量提取,抽取出事件触发词、论元和角色等中文事件要素,在大规模中文事件数据集DuEE上进行验证。结果表明,该模型与其他同类型模型相比,准确率和F_(1)值均有所提升,在大规模事件数据集上的准确率、召回率和F_(1)值分别为95.4%、77.8%和85.7%。
-
-
丁思媛;
乔晓东;
张运良
-
-
摘要:
[研究目的]为了帮助政府、企业和科研人员从海量的听证公开文本中发现科技相关政策和热点,快速、全面地识别出有价值的信息。[研究方法]梳理听证公开文本的类型与特点,并对其中有价值的信息进行合理的界定与分类;根据文本的内容特征和话语特征提出事件句识别、事件类型检测和事件论元抽取的三阶段式事件抽取方法,以实现有价值信息的抽取;对抽取的有价值信息进行深入分析。[研究结论]与基准模型相比,该研究所提方法在事件句识别召回率上提高33%,F_(1)提高17%,在事件类型检测的精确率上提高1%,在事件论元抽取的精确率上提高18%,召回率提高4%,取得了一定效果,为此类文本进一步分析提供了新研究思路。
-
-
韩志卓;
李慧波;
和凯;
肖若冰;
宋凯磊;
陈晓东
-
-
摘要:
事件抽取是抽取冗余非结构化文本中重要事件要素的关键技术,可用于重要信息的结构化存储与获取。常用的事件抽取方法如CRF存在事件要素抽取断裂,模型泛化能力弱的问题。为解决上述问题,本文提出基于预训练模型BERT的双向长短时记忆和SPAN指针网络混合模型(BERT-BiLSTM-SPAN),用于非结构化事件文本中的要素抽取。预训练模型BERT用于获取突发事件CEC数据集的语义嵌入特征向量,语义嵌入特征向量作为BiLSTM-SPAN网络的输入完成事件要素的提取并利用指针结构减少要素断裂。为增强模型的泛化能力,在BERT-BiLSTM-SAPN训练过程中加入对抗训练及使用标签平滑损失函数。实验结果表明,本文所提出的BERT-BiLSTM-SPAN算法在精准率、召回率、F1三个指标上较BERT-BiLSTM-CRF模型分别平均提高5.02%、14.63%、9.80%。
-
-
奚溪;
周思媛;
陈宇涵;
单威翰;
林群庚
-
-
摘要:
随着知识图谱的兴起与发展,其在事件梳理方面的应用也越来越广泛。基于知识图谱构建上市公司重要事件的发展脉络及影响链,有助于监管机构或投资者全面了解上市公司事件的发展态势。目前,已经有科研人员将知识图谱应用到金融领域,但仍存在准确度低/覆盖面不全等问题。针对以上问题,本文基于上市公司财经新闻、报导等信息,构建了上市公司事件知识图谱,并使用Neo4j图数据库对上市公司热点事件进行可视化建模。
-
-
马亚中;
张聪聪;
徐大鹏;
梅一多;
孙兴雷;
赵志宾;
王静宇
-
-
摘要:
随着城市大脑建设进程的推进,城市中积累了大量的物联网(IoT)设备和数据,利用海量设备数据对问题进行分析和溯源,对于城市大脑建设具有重要意义。该文基于资源描述框架和智能物联网协议概念,提出一种以城市物联网本体为基础的城市大脑知识图谱建设方法,城市大脑知识图谱模型融合多源异构数据,覆盖城市基本要素,实现对城市要素的全面感知和深度认知。该文重点探究了城市事件本体中的事件抽取,设计了一种新颖的语言模型框架对事件类型和论元联合抽取,与单模型分析对比,该联合模型较单模型的事件类型和论元F_(1)值分别提高0.4%和2.7%,在时间和模型复杂度上,较单模型级联也有更好效果。最后,该研究对知识图谱技术与人工智能、多传感器融合、GIS等新一代信息技术交叉融合方面进行了探究分析,为城市治理和服务应用场景提供理论依据。
-
-
安娜;
白雄文;
王红艳;
张萌
-
-
摘要:
为解决事件论元识别任务中特征提取不充分、角色重叠及角色论元嵌套等问题,提出一种改进的模型。将机器阅读理解思想融入事件抽取模型,设计问题模板,以BERT预训练模型构建动态词向量表征,融合双流注意力机制提取的特征向量,基于多层指针网络完成事件论元识别,与事件类型检测结果合并作为事件抽取模型的输出。在数据集DuEE上的实验结果表明,该模型获得了较高的准确率、召回率和F1值,验证了改进模型的可行性。
-
-
葛君伟;
乔蒙蒙;
方义秋
-
-
摘要:
基于句子级别的抽取方法不足以解决中文事件元素分散问题。针对该问题,提出基于上下文融合的文档级事件抽取方法。首先将文档分割为多个段落,利用双向长短期记忆网络提取段落序列特征;其次采用自注意力机制捕获段落上下文的交互信息;然后与文档序列特征融合以更新语义表示;最后采用序列标注方式抽取事件元素并匹配事件类型。与其他事件抽取方法在相同的中文数据集上进行对比,实验结果表明,该方法能有效抽取文档中分散的事件元素,并提升模型的抽取性能。
-
-
-
-
-
-
赵妍妍;
王啸吟;
秦兵;
车万翔;
刘挺
- 《第三届学术计算语言学研讨会》
| 2006年
-
摘要:
事件抽取是目前信息抽取研究领域的一个新的重要的研究课题.本文结合美国国家标准技术研究院(NIST)组织的自动内容抽取(ACE,Automatic Content Extraction)评测中的事件抽取任务的要求,在ACE2005的训练数据上进行事件抽取中事件类别识别的实验.实验中采用扩展从训练语料中提取出的触发词,构建触发词表,并结合两种机器学习方法--最大熵(ME,Maximum Entropy)和支持向量机(SVM,Support Vector Machine),抽取合适的特征,使得事件类别识别的F-Score分别达到了69.2%和69.9%.
-
-
-
-
-