面向数字人文的中国古代典籍词性自动标注研究——以SikuBERT预训练模型为例

耿云冬; 张逸勤; 刘欢; 王东波

首页> 中文期刊> 《图书馆论坛》 >面向数字人文的中国古代典籍词性自动标注研究——以SikuBERT预训练模型为例

面向数字人文的中国古代典籍词性自动标注研究——以SikuBERT预训练模型为例

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

在深度学习技术和预训练语言模型不断发展背景下,文章探讨面向数字人文研究需求的古文典籍文本词性自动标注问题。以校验后的高质量《四库全书》全文语料作为训练集,构建SikuBERT预训练语言模型,在源自多领域的16部古文典籍文本上开展词性自动标注实验。结果表明:SikuBERT预训练语言模型在词性自动标注任务中表现优良,词性标签总体预测准确率达到89.64%。文章还展示了单机版“SIKU-BERT典籍智能处理系统”的词性自动标注功能设计及应用。

著录项

来源
《图书馆论坛》 |2022年第6期|55-63|共9页
作者
耿云冬; 张逸勤; 刘欢; 王东波;
展开▼
作者单位

华中农业大学外国语学院;

南京大学信息管理学院;

南京农业大学信息管理学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算技术、计算机技术;
关键词
词性; 自动标注; 数字人文; SikuBERT; 预训练技术;

相似文献

中文文献
外文文献
专利

1. 面向数字人文的融合外部特征的典籍自动分词研究——以SikuBERT预训练模型为例 [J] . 刘畅 ,王东波 ,胡昊天 . 图书馆论坛 . 2022,第6期
2. SikuBERT与SikuRoBERTa:面向数字人文的《四库全书》预训练模型构建及应用研究 [J] . 王东波 ,刘畅 ,朱子赫 . 图书馆论坛 . 2022,第6期
3. 面向韵律层边界自动划分的维吾尔语词性自动标注技术研究 [J] . 努尔比娅·塔依尔 ,地里木拉提·吐尔逊 ,艾斯卡尔·肉孜 . 计算机应用与软件 . 2011,第008期
4. 面向复杂形态语言机器翻译的多模型融合词性标注研究 [J] . 李晓 ,蒋同海 ,周喜 . 网络新媒体技术 . 2014,第001期
5. 面向复杂形态语言机器翻译的多模型融合词性标注研究 [J] . 李晓 ,蒋同海 ,周喜 . 网络新媒体技术 . 2014,第001期
6. 一种基于改进的最大熵模型的汉语词性自动标注的新方法 [C] . 赵伟 ,长春工业大学计算机科学与工程学院 ,赵法兴 . 第二十三届中国数据库学术会议（NDBC2006） . 2006
7. 面向实体抽取的先秦典籍词性标记方法研究 [A] . 袁悦 . 2019

面向数字人文的中国古代典籍词性自动标注研究——以SikuBERT预训练模型为例

摘要

著录项

相似文献

相关主题

期刊订阅