首页> 中文会议>第七届中文信息处理国际会议 >命名实体识别:One-at-a-time or All-at-once? Word-based or Character-based?

命名实体识别:One-at-a-time or All-at-once? Word-based or Character-based?

页面导航

摘要
著录项
相似文献
相关主题

摘要

命名实体识别是找出文本中出现的人名、地名、机构名等,由于中英文的区别,中文本身没有分好词,在识别时,一种做法是先对文本分词后,再使用机器学习的方法进行识别,本文称之为基于词的方法(word-based)；但是能不能不分词而直接识别呢(character-based)?识别效果又怎样?另外需要考虑的问题是,在识别时,是应该分别建立模型(one-at-a-time)识别不同类型的实体,还是用一个统一的模型来同时(all-at-once)识别所有的实体呢?本文对上述问题作了深入的研究,发现all-at-once,character-based方法的识别结果最好,而one-at-a-time,character-based方法虽然在机构名的识别上略差,但模型总的训练时间比all-at-once短很多.另外,本文实体识别是基于CRF模型,尽管只用了简单的特征模板,但对于人名地名,F-measure在90％左右,机构名87％左右.

著录项

来源
《第七届中文信息处理国际会议》|2007年|409-414|共6页
会议地点武汉
作者
余军; 陈晓鸥;
展开▼
作者单位

中国中文信息学会;

武汉大学;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类文字信息处理;
关键词
中文命名; CRF模型; 实体识别; 特征模板; 文本分词;

相似文献

中文文献
外文文献
专利

1. 生物医学命名实体识别研究现状及中文生物医学命名实体识别难点与意义综述 [J] . 潘璀然 ,施维 ,薛均 . 医学信息学杂志 . 2018,第003期
2. 基于迁移学习的社交评论命名实体识别 [J] . 张晓 ,李业刚 ,王栋 . 计算机应用与软件 . 2022,第1期
3. 基于领域适应嵌入的军事命名实体识别 [J] . 刘凯 ,张宏军 ,陈飞琼 . 计算机科学 . 2022,第1期
4. 简要案情的命名实体识别技术 [J] . 陈柱辉 ,刘新 ,张明键 . 计算机系统应用 . 2022,第1期
5. 政治学文本的命名实体识别与可视化研究 [C] . Zhong Jin-hong ,钟金宏 ,Han Li-jun . 第十五届（2020）中国管理学年会 . 2020
6. 基于深度学习的中学数学知识命名实体识别 [A] . 程哲 . 2021

命名实体识别:One-at-a-time or All-at-once? Word-based or Character-based?

摘要

著录项

相似文献

相关主题

期刊订阅