您现在的位置：首页> 研究主题> 命名实体识别

命名实体识别

命名实体识别的相关文献在2002年到2023年内共计919篇，主要集中在自动化技术、计算机技术、基础医学、科学、科学研究等领域，其中期刊论文681篇、会议论文38篇、专利文献257904篇；相关期刊275种，包括现代图书情报技术、电子设计工程、计算机工程等；相关会议30种，包括第十九届网络新技术与应用年会、2011年江苏省人工智能学术会议、第十一届全国计算语言学学术会议等；命名实体识别的相关文献由2509位作者贡献，包括赵铁军、王浩畅、朱艳辉等。

命名实体识别—发文量

期刊论文>

论文：681篇占比：0.26%

会议论文>

论文：38篇占比：0.01%

专利文献>

论文：257904篇占比：99.72%

总计：258623篇

命名实体识别—发文趋势图

命名实体识别
-研究学者

赵铁军
王浩畅
朱艳辉
于浩
余正涛
林鸿飞
王东波
线岩团
郭剑毅
冀相冰
崔雷
王磊
于江德
刘爽
加日拉·买买提热衣木
吐尔根·依布拉音
孙忆南
张晓
张顺香
彭宏
戴新宇
朱国进
李业刚
李思
李明正
杨帆
杨建武
杨雅婷
梁文桐
樊孝忠
王健宗
王栋
王理
王蓬辉
程学旗
章鹏
艾山·吾买尔
袁清波
詹飞
陈刚
陈家骏
陈艳平
黄书剑
于伟
于凤英
于润羽
何亮
刘丹
刘凯
单波

命名实体识别
-相关主题

命名实体识别
-相关期刊

命名实体识别
-相关会议

期刊论文
会议论文
专利文献

搜索

排序：

专利类型

专利分类

学科

年份

2023
(2)
2022
(208)
2021
(211)
2020
(126)
2019
(80)
2018
(54)
2017
(30)
2016
(12)
2015
(10)
2014
(17)
2013
(5)
2012
(8)
2011
(12)
2010
(11)
2009
(14)
2008
(2)
2007
(9)
2006
(10)
2005
(2)

期刊

收录数据库

作者

赵铁军
(12)
王浩畅
(11)
朱艳辉
(8)
于浩
(7)
余正涛
(7)
林鸿飞
(7)
王东波
(7)
线岩团
(7)
郭剑毅
(6)
冀相冰
(5)
崔雷
(5)
王磊
(5)
于江德
(4)
刘爽
(4)
加日拉·买买提热衣木
(4)
吐尔根·依布拉音
(4)
孙忆南
(4)
张晓
(4)
张顺香
(4)
彭宏
(4)
戴新宇
(4)
朱国进
(4)
李业刚
(4)
李思
(4)
李明正
(4)
杨帆
(4)
杨建武
(4)
杨雅婷
(4)
梁文桐
(4)
樊孝忠
(4)
王健宗
(4)
王栋
(4)
王理
(4)
王蓬辉
(4)
程学旗
(4)
章鹏
(4)
艾山·吾买尔
(4)
袁清波
(4)
詹飞
(4)
陈刚
(4)
陈家骏
(4)
陈艳平
(4)
黄书剑
(4)
于伟
(3)
于凤英
(3)
于润羽
(3)
何亮
(3)
刘丹
(3)
刘凯
(3)
单波
(3)

关键词

申请/权力人

;

1. 基于BERT-BiLSTM-CRF模型的中文实体识别研究
- 沈同平；俞磊；金力；黄方亮；许欢庆
- 摘要：中文文本实体识别,是自然语言处理的关键问题.传统的语言处理模型无法有效表示文本中的上下文语义信息,无法处理一词多义的不同语境,影响实体识别效果.提出了一种BERT-BiLSTM-CRF的实体识别模型,BERT预处理语言模型生成表征上下文语义信息的词向量,通过双向长短期记忆网络对生成的向量进行特征提取,自注意力机制能够有效获取文本语句中的长距离依赖,最后通过CRF进行解码生成实体标签序列.实验结果表明,该模型在微软亚洲研究院MSRA语料库和人民日报语料库上都取得了优异成绩,F1分别达到96.12％和95.88％.
2. 基于Hadoop的并行化命名实体识别模型研究
- 蔡伊娜；包先雨；林燕奎；彭锦学；彭智彬；林泳奇；李俊霖；郭云
- 摘要：针对现有命名实体识别存在数据处理效率低的问题,该文提出了一种并行化Block-BAC模型。提出了前处理中的数据分块优化算法,并基于Hadoop实现并行化的运作机制;采用局部注意力优化机制,有效减少模型的隐层节点。与已有的BERT-BAC模型相比,在确保较高F;值(精确率和召回率的调和平均数)的情况下,该模型训练时间和实体识别时间分别缩短60.36%、39.43%,具有更广泛的实用性。
3. 基于自动弱标注数据的跨领域命名实体识别
- 方晔玮；王铭涛；陈文亮；张熠天；张民
- 摘要：近年来,在大规模标注语料上训练的神经网络模型大大提升了命名实体识别任务的性能。但是,新领域人工标注数据获取代价高昂,如何快速、低成本地进行领域迁移就显得非常重要。在目标领域仅给定无标注数据的情况下,该文尝试自动构建目标领域的弱标注语料并对其建模。首先,采用两种不同的方法对无标注数据进行自动标注;然后,采用留“同”去“异”的方式,尽量减少错误标注,自动生成局部标注的语料;最终,该文提出一种新的基于局部标注学习的实体识别模型,该模型可以在弱标注数据上进行训练。新闻领域到社交领域和金融领域的迁移实验结果证明,该文方法能有效提升命名实体识别模型的领域自适应性能,并且迁移代价较低。在加入预训练语言模型BERT的条件下,该方法也表现出较好的性能。
4. 命名实体识别技术研究进展综述
- 江千军；桂前进；王磊；徐瑞翔；王京景；麦立；许水清
- 摘要：命名实体识别是指从文本中提取出专有名词或特定命名实体的识别任务,作为信息抽取中非结构化数据转化为结构化数据的关键步骤,在机器翻译、情感分析、信息检索等领域有广泛应用,是自然语言处理的热点问题。文章就现有的命名实体识别技术方法进行了详细地梳理,重点阐述了基于深度学习的命名实体识别方法及其实现过程,进而分析了具有代表性的典型算法的优缺点,并对命名实体识别技术在电力系统中的应用前景进行了展望。
5. 煤矿事故案例命名实体识别方法研究
- 潘理虎；赵彭彭；龚大立；闫慧敏；张英俊
- 摘要：命名实体识别是自然语言处理的一项重要技术,也是问答系统、句法分析、机器翻译等下游工作的基本任务。煤矿事故案例命名实体识别是构建煤矿安全生产知识图谱的关键环节,其效率和准确率直接影响后期知识图谱的质量。针对传统命名实体识别方法训练时间长、识别率低的问题及煤矿事故案例的描述特点,以自构的标注语料集CoalMineCorpus为研究对象,基于深度学习算法,该文提出了一种结合ALBERT和迭代扩张卷积的命名实体识别方法。首先引入ALBERT预训练语言模型生成字向量,提升传统字向量的文本表示能力;然后将字向量序列输入改进的卷积神经网络中,其中卷积层采用四个三层结构的迭代扩张卷积模块完成特征抽取,采用RELU激活函数,取消池化层避免特征损失,使用Dropout和自适应矩估计对模型进行优化;最后使用条件随机场对标签序列结果进行合法性约束。实验结果表明,该模型在较大提升准确率、召回率和F值的同时可以有效缩短训练时间,可用于煤矿事故领域的命名实体识别工作。
6. 基于两段高速网络的命名实体识别
- 陈淳；李明扬；孔芳
- 摘要：命名实体识别作为自然语言处理领域的基础问题一直备受关注。中文命名实体特别是组合命名实体,由于其内部结构复杂,故长度可以很长,已有的研究还存在以下两个问题:一是字和词之间的关联信息未能充分挖掘,无法将组合实体和简单实体做统一处理;二是组合实体加大了实体序列长短的差异,文本自身信息的捕获不充分。针对问题一,该文借助融合了双向注意力机制的高速网络来充分挖掘字与词之间的关联关系,通过抽取词内部多种有效的字的组合来丰富词的表征;针对问题二,通过自注意力机制从多层次、多视角捕获文本信息,并借助高速网络进行信息的有效桥接。在OntoNotes V 4.0公开语料上的实验结果表明了该文方案的有效性,在不使用大型预训练语言模型的情况下,该文提出的基于两段高速网络的模型取得了目前最好的性能。
7. 民航不文明旅客实体识别方法研究
- 曹卫东；徐秀丽
- 摘要：针对民航旅客机上接打电话、扰乱其他乘客等各种不循规行为,提出了一种Tag+Bi-LSTM+CRF神经网络模型,可识别出不文明旅客实体信息。考虑到民航文本记录中一条语句中有多个实体,实体出现在句子中的模式可能包含有用的语义信息,将命名实体识别任务中的字符通过BIOES标记方法标记后与词嵌入、位置嵌入串联,以丰富输入表示。首先,利用Yedda工具对民航旅客随机记录文本中的实体进行标注,结合词嵌入、位置嵌入作为模型输入,其次,采用双向长短时记忆网络(Bi-LSTM,bi-directional long short-term memory)模型获取序列文本的上下文特征,然后,通过条件随机场(CRF,conditional random field)模型获得序列标注结果,最后,分别在输入层和Bi-LSTM层添加dropout层,防止数据过拟合。实验结果表明,该模型在民航不文明旅客实体识别中精确率、召回率和F1均高达96%以上,能有效获取不文明旅客行为、等级、处罚、期限等信息。
8. 面向工艺文本的命名实体识别方法研究
- 贾猛；王裴岩；张桂平；蔡东风
- 摘要：面向工艺文本中的命名实体,该文提出一种融入领域知识的神经网络命名实体识别方法,旨在对零件、工程图纸、参考标准、属性等12类命名实体进行识别。该方法针对工艺实体的特点,利用领域词典及规则预识别出部分实体,形成预识别实体特征,将预识别实体特征加入CNN-BiLSTM-CRF神经网络模型,指导训练与预测。实验结果表明,该方法在工艺文本中能较好地完成命名实体识别任务,在提高词典及规则覆盖的实体识别效果的同时,还能够提高其他类实体的识别效果,通过加入预识别实体特征,使得F_(1)值从90.99%提升到93.03%,验证了该文方法的有效性。
9. 基于命名实体识别的试题自动分割方法
- 巩稼民；赵梦凯；孙一斌；蒋杰伟；张凯泽
- 摘要：试题分割的准确性直接影响着试题库建设的质量。受限于试题文档的类型和编写规范,当前试题自动分割方法在复杂类型和包含富文本信息的试题文档上的准确率仍有待提高。通过将试题中的标题、题号、选项号、答案、解析等关键词抽象为实体,提出了一种基于命名实体识别的试题自动分割方法。将标注的实体作为分割点,实现试题的自动拆分。自建试题语料作为训练数据,并设定了文档预处理规则,对试题中的图表、字体样式等关键信息进行特定标记。构建了多个实体识别模型进行实验,结果表明:基于BERT+双向长短时记忆(Bi-LSTM)+条件随机场(CRF)的实体识别模型F1值相对于Bi-LSTM+CRF模型和CRF模型分别提升了3.31%和13.17%。
10. 基于词嵌入结合BiLSTM-CRF模型的病历实体识别
- 李超凡；马凯
- 摘要：在传统中文电子病历的命名实体识别任务中,针对医疗实体边界不清、实体嵌套、语句成分缺失、高度依赖人工提取特征等问题,提出基于词嵌入结合BiLSTM-CRF模型的中文电子病历命名实体识别模型。将电子病历文本数据集进行脱敏处理及序列标注等数据预处理,结合词嵌入匹配病历文本序列进行词向量化表示,利用BiLSTM神经网络对前后向病历文本进行空间语义建模,获取文本序列的语义特征,然后利用CRF预测实体标签输出。实验结果表明,改进后的BiLSTM-CRF模型显著提高了病历实体识别的准确率和召回率。

1. 命名实体识别方法和命名实体识别装置
- 航天宏康智能科技(北京)有限公司
- 公开公告日期：2022.02.15
- 摘要：本公开提供一种命名实体识别方法和命名实体识别装置。所述命名实体识别方法适用于嵌套命名实体与非嵌套命名实体，包括：获取自然语言文本数据；基于预先训练的处理模型，获取所述自然语言文本数据中的每个字符的特征向量，将每个字符的特征向量映射为二元互斥标记，并将所有二元互斥标记组合为二维矩阵，其中，每个特征向量的元素的数量基于命名实体的类别的数量来确定；基于所述二维矩阵，识别所述自然语言文本数据中的各个命名实体。
2. 命名实体识别方法、命名实体识别装置、设备及介质
- 京东方科技集团股份有限公司
- 公开公告日期：2022.06.21
- 摘要：公开了一种命名实体识别方法、命名实体识别装置、命名实体识别设备及介质，包括：采集特定场景下的语音信号；提取语音信号中的语音特征向量；基于语音信号进行语音识别后的文字结果，提取所述文字结果中的文字特征向量；将语音特征向量与文字特征向量进行拼接，得到所述语音信号中每个字的复合特征向量；将语音信号中每个字的所述复合特征向量通过深度学习模型进行处理，得到命名实体的识别结果。
3. 命名实体识别模型训练方法及命名实体识别方法
- 阿里巴巴达摩院(杭州)科技有限公司
- 公开公告日期：2022.09.23
- 摘要：本说明书实施例提供命名实体识别模型训练方法及命名实体识别方法，其中所述命名实体识别模型训练方法包括：获取第一训练集、第二训练集和预训练的资源模型；利用第一训练集，对第二预设语言模型进行训练，得到目标模型；从第二训练集中提取任一第二资源词条，将该第二资源词条分别输入资源模型和目标模型，得到该第二资源词条的第一资源类别和第二资源类别；根据第一资源类别和第二资源类别调整目标模型的模型参数，返回执行从第二训练集中提取任一第二资源词条的步骤，在达到第一预设训练停止条件的情况下，确定训练后的目标模型作为命名实体识别模型。提高了命名实体识别模型的可靠性，提高基于命名实体识别模型进行命名实体识别的准确度。
4. 命名实体识别模型建立方法及命名实体识别方法
- 北京中科凡语科技有限公司
- 公开公告日期：2021.08.24
- 摘要：本公开提供一种命名实体识别模型建立方法，其包括：获取目标领域的训练文本集；基于所述目标领域的领域特征构建命名实体种类集以及文本段落类别集；基于所述文本段落类别集以及所述命名实体种类集构建“文本段落类别‑命名实体种类”映射字典；使用所述“文本段落类别‑命名实体种类”映射字典对所述训练文本集中的所有训练文本进行标注，获得每个训练文本的标注序列集；以及至少基于所述训练文本集的所有训练文本的标注序列集进行命名实体识别模型训练，获得命名实体识别模型。本公开还提供一种命名实体识别方法、实体识别模型建立装置、命名实体识别装置、电子设备及存储介质。
5. 命名实体识别方法和命名实体识别装置
- 阿里巴巴集团控股有限公司
- 公开公告日期：2022-04-12
- 摘要：本申请公开了一种命名实体识别方法和命名实体识别装置。所述命名实体识别方法，包括：解析所述输入文本，获得所述输入文本对应的多个候选依存树结构；从所获得的多个候选依存树结构中利用推断的方式获得所述输入文本对应的目标依存树结构；将所述输入文本和所述输入文本对应的目标依存树结构输入命名实体识别模型，获得所述输入文本对应的命名实体序列。
6. 命名实体识别模型训练方法及命名实体识别方法
- 阿里巴巴达摩院(杭州)科技有限公司
- 公开公告日期：2022-05-27
- 摘要：本说明书实施例提供命名实体识别模型训练方法及命名实体识别方法，其中所述命名实体识别模型训练方法包括：获取第一训练集、第二训练集和预训练的资源模型；利用第一训练集，对第二预设语言模型进行训练，得到目标模型；从第二训练集中提取任一第二资源词条，将该第二资源词条分别输入资源模型和目标模型，得到该第二资源词条的第一资源类别和第二资源类别；根据第一资源类别和第二资源类别调整目标模型的模型参数，返回执行从第二训练集中提取任一第二资源词条的步骤，在达到第一预设训练停止条件的情况下，确定训练后的目标模型作为命名实体识别模型。提高了命名实体识别模型的可靠性，提高基于命名实体识别模型进行命名实体识别的准确度。
7. 一种命名实体识别模型的训练方法和命名实体的识别方法
- 马上消费金融股份有限公司
- 公开公告日期：2022-05-27
- 摘要：本发明提供一种命名实体识别模型的训练方法和命名实体的识别方法，其中，命名实体识别模型的训练方法，包括：获取训练数据，其中，所述训练数据包括训练文本和标识信息，所述训练文本包括第一命名实体和第一指示信息，所述第一指示信息与所述第一命名实体相关联，所述标识信息用于指示所述第一命名实体与所述第一指示信息在所述训练文本中的位置；将所述训练数据输入预先构建的学习模型进行训练，得到所述命名实体识别模型。本发明实施例提供的方案至少可以解决现有的命名实体的识别方法存在识别的准确性较差的问题。
8. 命名实体识别模型的训练方法和命名实体识别方法
- 中国工商银行股份有限公司
- 公开公告日期：2022-11-29
- 摘要：本申请涉及一种命名实体识别模型的训练方法和装置、命名实体识别方法和装置、计算机设备、存储介质和计算机程序产品，涉及人工智能技术领域，可用于金融科技领域或其他领域。所述方法包括：获取多个待标注标签的训练语料；基于预设知识库对训练语料进行实体标注，得到目标类别序列；将训练语料输入至命名实体识别模型进行实体识别，得到预测结果；基于第一类型损失函数和第二类型损失函数构建目标损失函数，基于预测结果、目标类别序列、目标损失函数，计算损失值；基于损失值和预设模型更新算法，对命名实体识别模型进行更新，基于更新后的命名实体识别模型确定目标命名实体识别模型。采用本方法能够提高命名实体识别模型的识别准确度。
9. 命名实体识别模型建立方法及命名实体识别方法
- 北京中科凡语科技有限公司
- 公开公告日期：2021-12-17
- 摘要：本公开提供一种命名实体识别模型建立方法，其包括：获取目标领域的训练文本集；基于目标领域的领域特征构建命名实体种类集以及文本段落类别集；基于文本段落类别集以及命名实体种类集构建“文本段落类别‑命名实体种类”映射字典；使用“文本段落类别‑命名实体种类”映射字典对训练文本集中的所有训练文本进行标注，获得每个训练文本的标注序列集，对每个训练文本的标注序列集进行修正，获得修正后的标注序列集；以及至少基于训练文本集的所有训练文本的修正后的标注序列集进行命名实体识别模型训练，获得命名实体识别模型。本公开还提供一种命名实体识别方法、实体识别模型建立装置、命名实体识别装置、电子设备及存储介质。
10. 命名实体识别模型获取及命名实体识别方法、装置及介质
- 北京百度网讯科技有限公司
- 公开公告日期：2021-04-09
- 摘要：本公开公开了命名实体识别模型获取及命名实体识别方法、装置及介质，涉及自然语言处理、深度学习及计算机视觉等人工智能领域，其中的模型获取方法可包括：对训练文本进行分词处理，利用各分词结果组成第一序列；将第一序列中至少包括两个单字且为非高频词的分词结果拆分为单字；将进行拆分处理后的所述第一序列中的单字对应的字嵌入向量及至少包括两个单字的高频词对应的词嵌入向量作为命名实体识别模型的输入，训练命名实体识别模型。应用本公开所述方案，可提升模型训练效果及模型性能，并可相应地提升基于模型得到的命名实体识别结果的准确性等。

命名实体识别

命名实体识别—发文量

命名实体识别—发文趋势图

命名实体识别-研究学者

命名实体识别-相关主题

命名实体识别-相关期刊

命名实体识别-相关会议

命名实体识别
-研究学者

命名实体识别
-相关主题

命名实体识别
-相关期刊

命名实体识别
-相关会议