您现在的位置: 首页> 研究主题> 自然语言处理

自然语言处理

自然语言处理的相关文献在1981年到2023年内共计3853篇,主要集中在自动化技术、计算机技术、语言学、信息与知识传播 等领域,其中期刊论文3024篇、会议论文325篇、专利文献1100842篇;相关期刊945种,包括电脑知识与技术、计算机工程、计算机工程与设计等; 相关会议136种,包括第六届全国青年计算语言学会议、第四届全国信息检索与内容安全学术会议、第九届全国计算语言学学术会议等;自然语言处理的相关文献由7645位作者贡献,包括刘挺、赵铁军、俞士汶等。

自然语言处理—发文量

期刊论文>

论文:3024 占比:0.27%

会议论文>

论文:325 占比:0.03%

专利文献>

论文:1100842 占比:99.70%

总计:1104191篇

自然语言处理—发文趋势图

自然语言处理

-研究学者

  • 刘挺
  • 赵铁军
  • 俞士汶
  • 李生
  • 冯志伟
  • 孙茂松
  • 姚天顺
  • 刘群
  • 昝红英
  • 朱学锋
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

作者

    • 孙红; 陈强越
    • 摘要: 文本分类是自然语言处理的一个重要领域.近年来,深度学习的方法被广泛应用于文本分类任务中.在处理大规模的数据时,为了兼顾分类的精度和处理效率,本文使用BERT训练词向量作为嵌入层,进一步优化输入语句的词向量,然后用双层的GRU网络作为主体网络,充分提取文本的上下文特征,最后使用注意力机制,将目标语句重点突出,进行文本分类.实验证明,BERT作为嵌入层输入时,有效优化了词向量.同时,文本提出的BBGA模型具有高效的处理能力,在处理THUCNews数据集时,达到了94.34%的精确度,比TextCNN高出5.20%,比BERT;NN高出1.01%.
    • 何苑; 张洪忠; 张尔坤
    • 摘要: 当前,自然语言处理(NLP)在传媒领域已得到广泛应用,成为媒体融合转型的一项重要人工智能技术。本文梳理了近一年来该技术在智能传播领域的应用现状,并从智能信息采集与输出、视觉内容生成与修复、语音内容合成与还原、AI虚拟主播四大应用场景出发,对与之相伴而生的问题风险和风控措施进行分析。进一步提出在NLP全方位向传媒领域渗透的大趋势下,新闻传播从业者既要积极提升自身对新技术的驾驭能力,也要防范技术应用带来的问题,以促进智能传播的健康发展。
    • 陈共驰; 荣欢; 马廷淮
    • 摘要: 技术旨在凝练给定文本,以篇幅较短的摘要有效反映出原文核心内容。现阶段,生成型文本摘要技术因能够以更加灵活丰富的词汇对原文进行转述,已成为文本摘要领域的研究热点。然而,现有生成型文本摘要模型在产生摘要语句时涉及对原有词汇的重组与新词的添加,易造成摘要语句不连贯、可读性低。此外,通过传统基于已标注数据的有监督训练提升摘要语句连贯性,需投入较高的数据成本,致使实际应用受限。为此,提出了一种面向连贯性强化的无真值依赖文本摘要(生成)模型(ATS;G)。该模型在仅给定原文本的限制条件下,一方面,基于原文本的编码结果,产生语句抽取标识,刻画对原文关键信息的筛选过程,由解码器对筛选后的语句编码进行解码;另一方面,基于解码器输出的原始词汇分布,分别按"概率选择"与按"Softmax-贪婪选择"产生两类摘要文本。综合语句连贯性与语句内容两方面,构建两类摘要文本的总体收益后,利用自评判策略梯度,引导模型学习关键语句筛选以及对所筛选关键语句进行解码,生成语句连贯性高、内容质量好的摘要文本。实验表明,即便不给定任何事先标注的摘要真值,所提出模型的摘要内容指标总体上仍优于现有文本摘要方法;与此同时,ATS;G生成的摘要文本在语句连贯性、内容重要性、信息冗余性、词汇新颖度和摘要困惑度方面亦优于现有方法。
    • 陈安龙; 孙驰; 马璇
    • 摘要: 近年来,主管部门和相关企业对景区与酒店等旅游目的地的"美誉度"越来越重视。旅游目的地的评价好坏也成为关注的焦点。文章正是对景区和酒店的网上评论进行分析,运用"模糊综合评价法"对各景区及酒店的服务、位置、设施、卫生、性价比五个方面建立"结合总体情感倾向的打分模型"计算评分,然后将计算的评分与实际得分进行比较,得到均方偏差:景区为0.177,酒店为0.077,预测的平均误差小于5%。文章建立的模型预测分数与原始数据评分高度一致,有较好的准确性和客观性,可用于帮助酒店、景区的经营者来发现用户的痛点;也可用于帮助主管部门发现运营场所存在的问题。
    • 张吉祥; 张祥森; 武长旭; 赵增顺
    • 摘要: 知识图谱在医疗、金融、农业等领域得到快速发展与广泛应用,其可以高效整合海量数据的有效信息,为实现语义智能化搜索以及知识互联打下基础。随着深度学习的发展,传统基于规则和模板的知识图谱构建技术已经逐渐被深度学习所替代。梳理知识抽取、知识融合、知识推理3类知识图谱构建技术的发展历程,重点分析基于卷积神经网络、循环神经网络等深度学习的知识图谱构建方法,并归纳现有方法的优劣性与发展思路。此外,深度学习虽然在自然语言处理、计算机视觉等领域取得了较大成果,但自身存在依赖大规模样本、缺乏推理性与可解释性等缺陷,限制了其进一步发展。为此,对知识图谱应用于深度学习以改善深度学习自身缺陷的相关方法进行整理,分析深度学习的可解释性、指导性以及因果推理性,归纳知识图谱的优势以及发展的必要性。在此基础上,对知识图谱构建技术以及知识图谱应用于深度学习所面临的困难和挑战进行梳理和分析,并对该领域的发展前景加以展望。
    • 夏林中; 叶剑锋; 罗德安; 管明祥; 刘俊; 曹雪梅
    • 摘要: 针对短文本自动评分中存在的特征稀疏、一词多义及上下文关联信息少等问题,提出一种基于BERT-BiLSTM(bidirectional encoder representations from transformers-bidirectional long short-term memory)的短文本自动评分模型.使用BERT(bidirectional encoder representations from transformers)语言模型预训练大规模语料库习得通用语言的语义特征,通过预训练好的BERT语言模型预微调下游具体任务的短文本数据集习得短文本的语义特征和关键词特定含义,再通过BiLSTM(bidirectional long short-term memory)捕获深层次上下文关联信息,最后将获得的特征向量输入Softmax回归模型进行自动评分.实验结果表明,对比CNN(convolutional neural networks)、CharCNN(character-level CNN)、LSTM(long short-term memory)和BERT等基准模型,基于BERT-BiLSTM的短文本自动评分模型所获的二次加权kappa系数平均值最优.
    • 赵兰枝; 史欣沅
    • 摘要: 随着深度学习的崛起,越来越多的人使用深度学习的方法来研究实体标准化。基于神经网络的各种复杂模型都需要大量的标注数据来进行训练,当可用的训练数据较少时其性能急剧下降。文章使用结合基于卷积神经网络的模型来研究实体标准化。标准实体由向量空间模型处理成为标准向量,预标注文本中的通俗实体经由卷积神经网络提取其中的语义特征并转化成为特征向量。在新的特征空间中,词义相近的2个特征向量之间的余弦距离应当较小。文章使用完美匹配模块来提升模型准确率和训练效率,仅采用1个卷积层和2个全连接层的浅层网络结构极大降低模型的复杂程度。整合3个结构相同但卷积核大小不同的网络模型保证模型的可靠性。5-折交叉验证来被用来提升模型的泛化能力。得益于卷积神经网络,该模型能够很好地捕捉到词向量的特征并将其标准化。简单的网络结构使得模型在可用的训练数据较少时也能够有出色表现。
    • 易晓宇; 易绵竹
    • 摘要: 概念规范化是将医学文本中的术语与其在UMLS■等术语中的概念相关联的任务.传统医学概念规范化方法在很大程度上取决于数据的覆盖范围,这给非英语的其他语言带来了不便.研究专注于命名实体识别系统提取和标记的实体指称,并使用UMLS概念唯一标识符对实体指称进行分类.在无需翻译语言的情况下,利用可用术语和嵌入模型的多语言特性来改进中文的概念规范化.将中文语料医学概念规范化系统建设视为多分类问题,使用术语上下文信息对术语进行编码,并通过余弦相似度和softmax函数对其进行分类.通过基于医渡云结构化4K数据集的实验验证,即使在没有标记数据的情况下也可以取得良好的结果;在标记数据的情况下优于现有的监督方法.为处理非英语语言的医学文本提供了更简单、更有效的多语言方法.将大量医学专业知识和医学术语融合UMLS,扩大术语覆盖范围,加强推进医学概念规范化,提高临床科研的效率与质量.
    • 杨磊; 刘宗凡; 邱元阳; 金琦; 倪俊杰
    • 摘要: 深度学习是新一代机器学习技术,深度学习技术的不断发展对自然语言处理技术产生了深远的影响。本期我们将讨论传统自然语言处理技术和以深度学习为基础的新一代自然语言处理技术基本方法,以及利用深度学习技术实现自然语言处理应用案例。
    • 李伯犀; 杨百合; 赵玉栋; 孔杨; 吴自成
    • 摘要: 机器视觉以图像为输入,在大数据、云计算和人工智能等技术的支持下,完成施工图纸的语义解析,实现图纸元素的自动识别,从而将既有图纸整理成便于计算机理解和存储的结构化数据,为智能设计、智能审查、智能运维提供坚实的数据基础。1.住建领域人工智能的发展随着近年来人工智能在深度学习算法的突破,迎来了新一轮科技革命和产业变革。自2017年以来,人工智能作为国家的战略目标多次被写入政府工作报告,并迅速在医疗、教育、金融等行业逐渐落地,顺利孵化了新的行业应用场景,在计算机视觉、自然语言处理和数据挖掘等人工智能核心技术的赋能下解决了行业痛点,提升了行业效率,帮助多行业实现了智慧化转型。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号