您现在的位置：首页> 研究主题> 自然语言处理

自然语言处理

自然语言处理的相关文献在1981年到2023年内共计3853篇，主要集中在自动化技术、计算机技术、语言学、信息与知识传播等领域，其中期刊论文3024篇、会议论文325篇、专利文献1100842篇；相关期刊945种，包括电脑知识与技术、计算机工程、计算机工程与设计等；相关会议136种，包括第六届全国青年计算语言学会议、第四届全国信息检索与内容安全学术会议、第九届全国计算语言学学术会议等；自然语言处理的相关文献由7645位作者贡献，包括刘挺、赵铁军、俞士汶等。

自然语言处理—发文量

期刊论文>

论文：3024篇占比：0.27%

会议论文>

论文：325篇占比：0.03%

专利文献>

论文：1100842篇占比：99.70%

总计：1104191篇

自然语言处理—发文趋势图

自然语言处理
-研究学者

刘挺
赵铁军
俞士汶
李生
冯志伟
孙茂松
姚天顺
刘群
昝红英
朱学锋
朱巧明
朱靖波
王斌
赵军
黄昌宁
白硕
钟义信
刘洋
周国栋
罗森林
化柏林
张宇
李颖
王永成
何中市
吴立德
本刊记者
穗志方
陆汝占
黄萱菁
刘知远
姬东鸿
徐波
李寿山
李斌
林鸿飞
王挺
王晓龙
陈家骏
黄河燕
何婷婷
刘辉
吐尔根·依布拉音
周经野
孙乐
孟遥
宋柔
宗成庆
才智杰
李强

自然语言处理
-相关主题

自然语言处理
-相关期刊

自然语言处理
-相关会议

期刊论文
会议论文
专利文献

搜索

排序：

专利类型

专利分类

学科

年份

2023
(1)
2022
(458)
2021
(487)
2020
(373)
2019
(338)
2018
(228)
2017
(148)
2016
(117)
2015
(87)
2014
(72)
2013
(79)
2012
(71)
2011
(71)
2010
(72)
2009
(78)
2008
(68)
2007
(84)
2006
(74)
2005
(84)
2004
(55)
2003
(41)
2002
(26)
2001
(28)
2000
(25)
1999
(38)
1998
(31)
1997
(21)
1996
(14)
1995
(14)
1994
(13)
1993
(3)
1992
(7)
1991
(6)
1990
(3)
1989
(8)
1988
(2)
1987
(1)
1985
(6)
1984
(1)
1981
(1)

期刊

收录数据库

作者

刘挺
(33)
赵铁军
(23)
俞士汶
(21)
李生
(21)
冯志伟
(20)
孙茂松
(20)
姚天顺
(19)
刘群
(17)
昝红英
(14)
朱学锋
(14)
朱巧明
(14)
朱靖波
(14)
王斌
(14)
赵军
(14)
黄昌宁
(14)
白硕
(13)
钟义信
(13)
刘洋
(12)
周国栋
(12)
罗森林
(12)
化柏林
(11)
张宇
(11)
李颖
(11)
王永成
(11)
何中市
(10)
吴立德
(10)
本刊记者
(10)
穗志方
(10)
陆汝占
(10)
黄萱菁
(10)
刘知远
(9)
姬东鸿
(9)
徐波
(9)
李寿山
(9)
李斌
(9)
林鸿飞
(9)
王挺
(9)
王晓龙
(9)
陈家骏
(9)
黄河燕
(9)
何婷婷
(8)
刘辉
(8)
吐尔根·依布拉音
(8)
周经野
(8)
孙乐
(8)
孟遥
(8)
宋柔
(8)
宗成庆
(8)
才智杰
(8)
李强
(8)

关键词

申请/权力人

;

1. 融合BERT词嵌入和注意力机制的中文文本分类
- 孙红；陈强越
- 摘要：文本分类是自然语言处理的一个重要领域.近年来,深度学习的方法被广泛应用于文本分类任务中.在处理大规模的数据时,为了兼顾分类的精度和处理效率,本文使用BERT训练词向量作为嵌入层,进一步优化输入语句的词向量,然后用双层的GRU网络作为主体网络,充分提取文本的上下文特征,最后使用注意力机制,将目标语句重点突出,进行文本分类.实验证明,BERT作为嵌入层输入时,有效优化了词向量.同时,文本提出的BBGA模型具有高效的处理能力,在处理THUCNews数据集时,达到了94.34%的精确度,比TextCNN高出5.20%,比BERT;NN高出1.01%.
2. 基于自然语言技术的智能传播应用与风控分析
- 何苑；张洪忠；张尔坤
- 摘要：当前,自然语言处理(NLP)在传媒领域已得到广泛应用,成为媒体融合转型的一项重要人工智能技术。本文梳理了近一年来该技术在智能传播领域的应用现状,并从智能信息采集与输出、视觉内容生成与修复、语音内容合成与还原、AI虚拟主播四大应用场景出发,对与之相伴而生的问题风险和风控措施进行分析。进一步提出在NLP全方位向传媒领域渗透的大趋势下,新闻传播从业者既要积极提升自身对新技术的驾驭能力,也要防范技术应用带来的问题,以促进智能传播的健康发展。
3. 面向连贯性强化的无真值依赖文本摘要模型
- 陈共驰；荣欢；马廷淮
- 摘要：技术旨在凝练给定文本,以篇幅较短的摘要有效反映出原文核心内容。现阶段,生成型文本摘要技术因能够以更加灵活丰富的词汇对原文进行转述,已成为文本摘要领域的研究热点。然而,现有生成型文本摘要模型在产生摘要语句时涉及对原有词汇的重组与新词的添加,易造成摘要语句不连贯、可读性低。此外,通过传统基于已标注数据的有监督训练提升摘要语句连贯性,需投入较高的数据成本,致使实际应用受限。为此,提出了一种面向连贯性强化的无真值依赖文本摘要(生成)模型(ATS;G)。该模型在仅给定原文本的限制条件下,一方面,基于原文本的编码结果,产生语句抽取标识,刻画对原文关键信息的筛选过程,由解码器对筛选后的语句编码进行解码;另一方面,基于解码器输出的原始词汇分布,分别按"概率选择"与按"Softmax-贪婪选择"产生两类摘要文本。综合语句连贯性与语句内容两方面,构建两类摘要文本的总体收益后,利用自评判策略梯度,引导模型学习关键语句筛选以及对所筛选关键语句进行解码,生成语句连贯性高、内容质量好的摘要文本。实验表明,即便不给定任何事先标注的摘要真值,所提出模型的摘要内容指标总体上仍优于现有文本摘要方法;与此同时,ATS;G生成的摘要文本在语句连贯性、内容重要性、信息冗余性、词汇新颖度和摘要困惑度方面亦优于现有方法。
4. 基于模糊综合评价的情感分析模型
- 陈安龙；孙驰；马璇
- 摘要：近年来,主管部门和相关企业对景区与酒店等旅游目的地的"美誉度"越来越重视。旅游目的地的评价好坏也成为关注的焦点。文章正是对景区和酒店的网上评论进行分析,运用"模糊综合评价法"对各景区及酒店的服务、位置、设施、卫生、性价比五个方面建立"结合总体情感倾向的打分模型"计算评分,然后将计算的评分与实际得分进行比较,得到均方偏差:景区为0.177,酒店为0.077,预测的平均误差小于5%。文章建立的模型预测分数与原始数据评分高度一致,有较好的准确性和客观性,可用于帮助酒店、景区的经营者来发现用户的痛点;也可用于帮助主管部门发现运营场所存在的问题。
5. 知识图谱构建技术综述
- 张吉祥；张祥森；武长旭；赵增顺
- 摘要：知识图谱在医疗、金融、农业等领域得到快速发展与广泛应用,其可以高效整合海量数据的有效信息,为实现语义智能化搜索以及知识互联打下基础。随着深度学习的发展,传统基于规则和模板的知识图谱构建技术已经逐渐被深度学习所替代。梳理知识抽取、知识融合、知识推理3类知识图谱构建技术的发展历程,重点分析基于卷积神经网络、循环神经网络等深度学习的知识图谱构建方法,并归纳现有方法的优劣性与发展思路。此外,深度学习虽然在自然语言处理、计算机视觉等领域取得了较大成果,但自身存在依赖大规模样本、缺乏推理性与可解释性等缺陷,限制了其进一步发展。为此,对知识图谱应用于深度学习以改善深度学习自身缺陷的相关方法进行整理,分析深度学习的可解释性、指导性以及因果推理性,归纳知识图谱的优势以及发展的必要性。在此基础上,对知识图谱构建技术以及知识图谱应用于深度学习所面临的困难和挑战进行梳理和分析,并对该领域的发展前景加以展望。
6. 基于BERT-BiLSTM模型的短文本自动评分系统
- 夏林中；叶剑锋；罗德安；管明祥；刘俊；曹雪梅
- 摘要：针对短文本自动评分中存在的特征稀疏、一词多义及上下文关联信息少等问题,提出一种基于BERT-BiLSTM(bidirectional encoder representations from transformers-bidirectional long short-term memory)的短文本自动评分模型.使用BERT(bidirectional encoder representations from transformers)语言模型预训练大规模语料库习得通用语言的语义特征,通过预训练好的BERT语言模型预微调下游具体任务的短文本数据集习得短文本的语义特征和关键词特定含义,再通过BiLSTM(bidirectional long short-term memory)捕获深层次上下文关联信息,最后将获得的特征向量输入Softmax回归模型进行自动评分.实验结果表明,对比CNN(convolutional neural networks)、CharCNN(character-level CNN)、LSTM(long short-term memory)和BERT等基准模型,基于BERT-BiLSTM的短文本自动评分模型所获的二次加权kappa系数平均值最优.
7. 基于卷积神经网络的生物医学实体标准化研究
- 赵兰枝；史欣沅
- 摘要：随着深度学习的崛起,越来越多的人使用深度学习的方法来研究实体标准化。基于神经网络的各种复杂模型都需要大量的标注数据来进行训练,当可用的训练数据较少时其性能急剧下降。文章使用结合基于卷积神经网络的模型来研究实体标准化。标准实体由向量空间模型处理成为标准向量,预标注文本中的通俗实体经由卷积神经网络提取其中的语义特征并转化成为特征向量。在新的特征空间中,词义相近的2个特征向量之间的余弦距离应当较小。文章使用完美匹配模块来提升模型准确率和训练效率,仅采用1个卷积层和2个全连接层的浅层网络结构极大降低模型的复杂程度。整合3个结构相同但卷积核大小不同的网络模型保证模型的可靠性。5-折交叉验证来被用来提升模型的泛化能力。得益于卷积神经网络,该模型能够很好地捕捉到词向量的特征并将其标准化。简单的网络结构使得模型在可用的训练数据较少时也能够有出色表现。
8. 基于中文语料的医学概念规范化研究
- 易晓宇；易绵竹
- 摘要：概念规范化是将医学文本中的术语与其在UMLS■等术语中的概念相关联的任务.传统医学概念规范化方法在很大程度上取决于数据的覆盖范围,这给非英语的其他语言带来了不便.研究专注于命名实体识别系统提取和标记的实体指称,并使用UMLS概念唯一标识符对实体指称进行分类.在无需翻译语言的情况下,利用可用术语和嵌入模型的多语言特性来改进中文的概念规范化.将中文语料医学概念规范化系统建设视为多分类问题,使用术语上下文信息对术语进行编码,并通过余弦相似度和softmax函数对其进行分类.通过基于医渡云结构化4K数据集的实验验证,即使在没有标记数据的情况下也可以取得良好的结果;在标记数据的情况下优于现有的监督方法.为处理非英语语言的医学文本提供了更简单、更有效的多语言方法.将大量医学专业知识和医学术语融合UMLS,扩大术语覆盖范围,加强推进医学概念规范化,提高临床科研的效率与质量.
9. 探秘自然语言处理
- 杨磊；刘宗凡；邱元阳；金琦；倪俊杰
- 摘要：深度学习是新一代机器学习技术,深度学习技术的不断发展对自然语言处理技术产生了深远的影响。本期我们将讨论传统自然语言处理技术和以深度学习为基础的新一代自然语言处理技术基本方法,以及利用深度学习技术实现自然语言处理应用案例。
10. 基于机器视觉的施工图识别技术与应用
- 李伯犀；杨百合；赵玉栋；孔杨；吴自成
- 摘要：机器视觉以图像为输入,在大数据、云计算和人工智能等技术的支持下,完成施工图纸的语义解析,实现图纸元素的自动识别,从而将既有图纸整理成便于计算机理解和存储的结构化数据,为智能设计、智能审查、智能运维提供坚实的数据基础。1.住建领域人工智能的发展随着近年来人工智能在深度学习算法的突破,迎来了新一轮科技革命和产业变革。自2017年以来,人工智能作为国家的战略目标多次被写入政府工作报告,并迅速在医疗、教育、金融等行业逐渐落地,顺利孵化了新的行业应用场景,在计算机视觉、自然语言处理和数据挖掘等人工智能核心技术的赋能下解决了行业痛点,提升了行业效率,帮助多行业实现了智慧化转型。

1. 自然语言处理系统、自然语言处理方法、以及自然语言处理程序
- 乐天株式会社
- 公开公告日期：2018.11.06
- 摘要：一实施方式所涉及的自然语言处理系统具备分析部以及修正部。分析部使用分割模型而执行对于一个句子的词素分析，从而对分割该一个句子而得到的各个被分割元素设定标签。分割模型包含表示被分割元素与标签的对应的输出特性的分数、和表示与连续的两个被分割元素对应的两个标签的组合的转移特性的分数。修正部对通过分析部而得到的分析结果所示的标签、和表示一个句子的正解的标签的正解数据进行比较，将与对应于非正解的标签的正解的标签关联的特性的分数提高，将与该非正解的标签关联的特性的分数降低，从而对分析部在下一个句子的词素分析中所使用的分割模型进行修正。
2. 自然语言处理模型的训练方法、自然语言处理方法及装置
- 北京百度网讯科技有限公司
- 公开公告日期：2022.07.12
- 摘要：本公开提供了一种自然语言处理模型的训练方法，涉及人工智能领域，尤其涉及自然语言处理领域。具体实现方案为：对输入文本进行针对多任务的语义学习，得到针对多任务的语义特征，其中，多任务包括多个分支任务；基于语义特征分别进行针对各个分支任务的特征学习，得到针对各个分支任务的第一输出结果；根据针对各个分支任务的第一输出结果，计算针对各个分支任务的损失；以及根据针对各个分支任务的损失，调整自然语言处理模型的参数。本公开还提供了一种自然语言处理模型的训练装置、自然语言处理方法及其装置、电子设备和存储介质。
3. 用于提供自然语言输出中的自然语言信号的自然语言处理器
- 国际商业机器公司
- 公开公告日期：2021.05.11
- 摘要：实施例针对被配置为接收自然语言(NL)输入并且执行分析操作以生成NL输出的自然语言处理(NLP)系统。NLP系统被配置为至少部分地基于分析操作的至少一部分来生成至少一个置信水平。NLP系统被进一步被配置为至少部分地基于所述至少一个置信水平将至少一个不流利表达集成到NL输出中。
4. 自然语言处理系统、自然语言处理方法以及自然语言处理程序
- 株式会社机器人之心
- 公开公告日期：2022-01-28
- 摘要：自然语言处理系统具有：场景设定部(10)，其解析输入的自然语言的语句，生成表示理解自然语言的主体的主体数据、以及表示主体行动的世界的一部分的场景数据，在场景数据中设定主体数据；状况变化设定部(11)，其解析输入的自然语言的语句，并设定场景的状况变化；正负情绪设定部(12)，其基于场景的状况变化，判定是否产生了对于主体而言有利的情绪即正情绪、或者对于主体而言不利的情绪即负情绪；以及含义解析部(13)，其基于产生的正负情绪进行含义解析。状况变化设定部(11)将在状况变化的前状态下作用于主体数据的价值和在状况变化的后状态下作用于主体数据的价值分别作为数值来获取。正负情绪设定部(12)计算前状态的数值与后状态的数值的差而计算出正负情绪。
5. 自然语言处理系统、自然语言处理方法、以及自然语言处理程序
- 乐天株式会社
- 公开公告日期：2016-10-12
- 摘要：一实施方式所涉及的自然语言处理系统具备分析部以及修正部。分析部使用分割模型而执行对于一个句子的词素分析，从而对分割该一个句子而得到的各个被分割元素设定标签。分割模型包含表示被分割元素与标签的对应的输出特性的分数、和表示与连续的两个被分割元素对应的两个标签的组合的转移特性的分数。修正部对通过分析部而得到的分析结果所示的标签、和表示一个句子的正解的标签的正解数据进行比较，将与对应于非正解的标签的正解的标签关联的特性的分数提高，将与该非正解的标签关联的特性的分数降低，从而对分析部在下一个句子的词素分析中所使用的分割模型进行修正。
6. 用于知识产权领域的自然语言处理系统以及自然语言处理方法
- 荷盛崧钜智财顾问股份有限公司
- 公开公告日期：2021-10-12
- 摘要：本发明揭露一种自然语言处理系统，用于知识产权领域，包括文意深度学习模块、规范用语数据处理单元以及结合学习单元。文意深度学习模块接收文本，以产生文本文意表征。规范用语数据处理单元包括字符串比对模块与神经网络数据处理模块。字符串比对模块接收文本，并利用预定的知识产权字典库比对文本以产生第一输入信息，神经网络数据处理模块接收第一输入信息，并依据第一输入信息产生文本规范表征。结合学习单元包括结合模块与分类器。结合模块结合文本文意表征与文本规范表征以产生一第二输入信息，分类器接收第二输入信息以产生文本标签。藉此，可以有效地纳入知识产权领域特有的文本规范，解决知识产权领域在文本分类上的缺点。
7. 训练自然语言处理模型和自然语言处理的方法、电子设备
- 京东方科技集团股份有限公司
- 公开公告日期：2021-11-09
- 摘要：本公开涉及一种训练自然语言处理模型和自然语言处理的方法、电子设备。训练自然语言处理模型的方法包括：获取训练用的语料数据；利用自然语言处理模型，对所述语料数据进行处理，得到输出信息，所述自然语言处理模型包括第一模型和第二模型，其中，所述第一模型用于对所述语料数据的拼音数据进行纠错，所述第二模型用于对纠错后的所述语料数据的拼音数据进行文字转换；根据所述自然语言处理模型的输出信息，训练所述自然语言处理模型，得到训练后的自然语言处理模型。
8. 自然语言处理模型的训练方法、自然语言处理方法及装置
- 北京百度网讯科技有限公司
- 公开公告日期：2021-09-07
- 摘要：本公开提供了一种自然语言处理模型的训练方法，涉及人工智能领域，尤其涉及自然语言处理领域。具体实现方案为：对输入文本进行针对多任务的语义学习，得到针对多任务的语义特征，其中，多任务包括多个分支任务；基于语义特征分别进行针对各个分支任务的特征学习，得到针对各个分支任务的第一输出结果；根据针对各个分支任务的第一输出结果，计算针对各个分支任务的损失；以及根据针对各个分支任务的损失，调整自然语言处理模型的参数。本公开还提供了一种自然语言处理模型的训练装置、自然语言处理方法及其装置、电子设备和存储介质。
9. 自然语言处理方法、自然语言处理装置及智能问答系统
- 微民保险代理有限公司
- 公开公告日期：2020-04-17
- 摘要：本申请实施例涉及一种自然语言处理方法、自然语言处理装置及智能问答系统。该方法包括：预处理接收的文本信息，形成由若干个单词组成的文本序列；在预设的知识图谱中，获取所述文本序列中包含的实体的知识信息；将所述知识信息与所述文本序列中对应的实体进行融合，生成融合序列；计算意图上下文信息并确定所述融合序列的意图；计算槽位上下文信息；结合所述意图上下文信息与所述槽位上下文信息，生成意图与槽位的关联信息并确定所述融合序列中每一个单词所属的槽位；通过所述单词所属的槽位以及所述融合序列的意图，确定所述文本信息的语义。其融合了预设的知识图谱中的实体信息，可以有效的提升计算对在特定专业领域的分析和理解能力。
10. 自然语言处理模型训练方法和自然语言处理模型
- 苏州思必驰信息科技有限公司
- 公开公告日期：2020-04-24
- 摘要：本发明公开一种自然语言处理模型训练方法，包括：将当前训练样本输入至输入层，以得到对应于当前训练样本的样本向量；LSTM神经网络对样本向量进行处理，以得到对应于当前训练样本的隐藏层输出；获取对应于当前训练样本的多个词义嵌入；输出层根据隐藏层输出和多个词义嵌入确定对应于每一个词义嵌入的权重值；根据多个词义嵌入和每一个词义嵌入的权重值确定对应于当前训练样本的消歧词嵌入；通过对消歧词嵌入和当前训练样本的真实词义嵌入进行最小化交叉熵处理，以完成对自然语言处理模型的训练。通过LSTM获取当前训练样本的上下文信息，从而能够基于LSTM的隐藏层输出确定出对应于当前训练样本的不同词义嵌入的各自的权重值，进而实现消歧的目的。

自然语言处理

自然语言处理—发文量

自然语言处理—发文趋势图

自然语言处理-研究学者

自然语言处理-相关主题

自然语言处理-相关期刊

自然语言处理-相关会议

自然语言处理
-研究学者

自然语言处理
-相关主题

自然语言处理
-相关期刊

自然语言处理
-相关会议