基于Transformer的自然语言处理预训练语言模型概述

史童月; 王中卿

首页> 中文期刊> 《信息与电脑》 >基于Transformer的自然语言处理预训练语言模型概述

基于Transformer的自然语言处理预训练语言模型概述

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

在自然语言处理领域,谷歌提出Transformer模型之后,以生成式预训练模型(Generative Pre-Training,GPT)和深度双向预训练语言模型(Bidirectional Encoder Representat ions from Transformers,BERT)等为代表的一些基于Transformer的预训练语言模型(Transformer-based Pre-trained Language Models,TPLM)相继被提出,在大部分自然语言处理任务上取得很好的效果。TPLM使用自监督学习方法学习来自大量文本数据的通用语言表示,并将这些知识转移到下游任务中,为其提供了背景知识,避免了重新开始训练新任务模型的情况。笔者主要研究了基于Transformer的预训练语言模型与基于TPLM的“预训练+微调”的自然语言处理预训练新技术模式。首先,介绍预训练模型的发展背景;其次,解释各种有关TPLM的核心概念,如预训练、预训练方法、预训练任务、自监督学习与迁移学习等;再次,简要介绍相关TPLM模型与目前的进展;最后,提出改进TPLM的方法并总结。

著录项

来源
《信息与电脑》 |2022年第10期|52-56|共5页
作者
史童月; 王中卿;
展开▼
作者单位

苏州大学计算机科学与技术学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类人工神经网络与计算;
关键词
TRANSFORMER; 自然语言处理; 预训练模型;

相似文献

中文文献
外文文献
专利

1. 基于预训练语言模型及交互注意力的平行句对抽取方法 [J] . 张乐乐 ,郭军军 ,王繁 . 通信技术 . 2022,第4期
2. 基于预训练语言模型的电力领域设备缺陷检测 [J] . 王宏刚 ,纪鑫 ,武同心 . 电测与仪表 . 2022,第5期
3. 基于预训练语言模型的关键词感知问题生成 [J] . 于尊瑞 ,毛震东 ,王泉 . 计算机工程 . 2022,第2期
4. 基于跨语种预训练语言模型XLM-R的神经机器翻译方法 [J] . 王倩 ,李茂西 ,吴水秀 . 北京大学学报:自然科学版 . 2022,第1期
5. 基于预训练语言模型的政策识别研究 [J] . 朱娜娜 ,王航 ,张家乐 . 中文信息学报 . 2022,第2期
6. CPLM-CSC:基于单字级别预训练语言模型的中文错别字纠正方法 [C] . Haihua XIE ,谢海华 ,Aolin LI . 第十八届中国计算语言学大会暨中国中文信息学会2019学术年会 . 2018
7. 基于Transformer预训练模型的语言特征分析及其应用 [A] . 徐东钦 . 2021

基于Transformer的自然语言处理预训练语言模型概述

摘要

著录项

相似文献

相关主题

期刊订阅