基于预训练表征模型的自动ICD编码

王天罡; 李晓亮; 张晓滨; 蔡宏伟

首页> 中文期刊> 《中国数字医学》 >基于预训练表征模型的自动ICD编码

基于预训练表征模型的自动ICD编码

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

目的:探索基于开源预训练表征模型的自然语言处理(Natural Language Processing,NLP)方法在电子病历ICD自动编码中的应用.方法:在电子病历文本字词向量的表达方面,传统基于浅层神经网络模型的Word2vec或基于深度学习模型Elmo等方法存在无法感知复杂上下文、语义单向编码等缺点.而近年来以BERT、ERNIE等基于Transformer编码的预训练字词表征技术在多个NLP场景中取得了较大的进步.通过对开源模型BERT采用微调(Fine-tuning),将三甲医院的439份电子病历的文字描述诊断所对应的ICD编码进行自动分类提取.结果:经过微调后的模型在准确率及召回率等指标相较于传统方法分别提升了21.1％和25.1％,使电子病历文本的特征表达能力得到了明显的提升.结论:基于预训练模型的迁移学习方法及双向语义感知能力体现了其处理大规模语料时的优势,对临床电子病历实际应用中ICD编码标准化、医院临床路径以及DRGs付费管理等NLP相关应用具有重要意义.

著录项

来源
《中国数字医学》 |2020年第7期|53-56|共4页
作者
王天罡; 李晓亮; 张晓滨; 蔡宏伟;
展开▼
作者单位

西安交通大学第一附属医院网络信息部 710061 陕西省西安市雁塔西路277号;

西安工程大学计算机科学学院 710048 陕西省西安市金花南路19号;

西安交通大学第一附属医院网络信息部 710061 陕西省西安市雁塔西路277号;

西安工程大学计算机科学学院 710048 陕西省西安市金花南路19号;

西安交通大学第一附属医院网络信息部 710061 陕西省西安市雁塔西路277号;

展开▼
原文格式 PDF
正文语种 chi
中图分类其他科学技术在医学上的应用;信息处理（信息加工）;
关键词
自然语言处理; 电子病历; BERT; ICD;

相似文献

中文文献
外文文献
专利

1. 基于BERT预训练模型的古汉语自动分词方法研究 [J] . 高毅 . 电子设计工程 . 2021,第022期
2. 基于预训练模型的大规模常识自动获取技术 [J] . 刘鑫 . 电子质量 . 2021,第007期
3. 基于预训练BERT模型的客服工单自动分类研究 [J] . 任莹 . 云南电力技术 . 2020,第001期
4. 基于深度预训练语言模型的文献学科自动分类研究 [J] . 罗鹏程 ,王一博 ,王继民 . 情报学报 . 2020,第010期
5. ALICE:一种面向中文科技文本分析的预训练语言表征模型 [J] . 王英杰 ,谢彬 ,李宁波 . 计算机工程 . 2020,第002期
6. 基于ICD编码的电子病历自动分类及统计分析系统 [C] . Mu Dongmei ,牟冬梅 ,Zhao Danning . 2016中国卫生信息技术交流大会 . 2016
7. 基于预训练模型及强化学习的自动文本摘要研究 [A] . 王亓才 . 2021

基于预训练表征模型的自动ICD编码

摘要

著录项

相似文献

相关主题

期刊订阅