结合预训练和自训练的法律信息抽取增强式方法

周裕林; 陈艳平; 黄瑞章; 秦永彬; 林川

首页> 中文期刊> 《燕山大学学报》 >结合预训练和自训练的法律信息抽取增强式方法

结合预训练和自训练的法律信息抽取增强式方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

在“智慧法院”的建设中,法律信息抽取是法律人工智能任务中最基本的任务。目前,法律信息抽取方法主要基于深度神经网络的监督学习模型。由于现有的监督学习模型需要大量的标签数据,而人工标注的方式会提高法律信息抽取任务的成本,存在只有少样本情况下模型学习性能较差的问题。针对上述问题,提出一种结合预训练和自训练的法律信息抽取增强式方法。首先,利用大规模预训练模型和标签数据训练出一个教师模型;然后,利用改进的文本相似度计算公式从法律文书库中寻找出与训练集相似的无标签法律文本数据,再结合训练完成的教师模型对其生成伪标签数据;最后,将有标签数据和伪标签数据混合起来重新训练出一个学生模型用于下游的法律信息抽取任务。本文在2021法研杯提供的信息抽取数据集上进行验证。与基线模型进行对比,本文提出的结合预训练和自训练的法律信息抽取增强式方法取得了较好的抽取效果。

著录项

来源
《燕山大学学报》 |2023年第3期|255-261|共7页
作者
周裕林; 陈艳平; 黄瑞章; 秦永彬; 林川;
展开▼
作者单位

公共大数据国家重点实验室;

贵州大学计算机科学与技术学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
预训练; 法律信息抽取; 自训练; 人工智能; 自然语言处理;

相似文献

中文文献
外文文献
专利

1. 基于预训练语言模型的管制信息抽取方法 [J] . 张潇霄 ,王煊 ,王磊 . 指挥控制与仿真 . 2023,第2期
2. 基于预训练和多层次信息的中文人物关系抽取模型 [J] . 姚博文 ,曾碧卿 ,蔡剑 . 计算机应用 . 2021,第12期
3. 融合预训练模型和注意力的实体关系抽取方法 [J] . 李智杰 ,韩瑞瑞 ,李昌华 . 计算机科学与探索 . 2023,第6期
4. 基于预训练语言模型及交互注意力的平行句对抽取方法 [J] . 张乐乐 ,郭军军 ,王繁 . 通信技术 . 2022,第4期
5. 融合预训练语言模型和标签依赖知识的关系抽取方法 [J] . 赵超 ,谢松县 ,曾道建 . 中文信息学报 . 2022,第1期
6. 动态拉伸结合增强式训练对男子橄榄球运动员身体功能影响的研究 [C] . 鲁智勇 ,娄志堃 ,胡英琪 . 2015第十届全国体育科学大会 . 2015

结合预训练和自训练的法律信息抽取增强式方法

摘要

著录项

相似文献

相关主题

期刊订阅