基于症状构成成分的上下位关系自动抽取方法

王婷; 王祺; 黄越圻; 殷亦超; 高炬

首页> 中文期刊> 《计算机应用》 >基于症状构成成分的上下位关系自动抽取方法

基于症状构成成分的上下位关系自动抽取方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对症状间上下位关系具有较强结构特性的问题,提出一种基于症状构成成分的上下位关系自动抽取方法.首先,通过观察症状实体,发现症状可以切分为原子症状词、修饰词等八种成分,且成分的构成序列满足一定的规则.然后,利用词法分析系统和条件随机场模型对症状进行切分和成分标注.最后,把症状之间的关系抽取看作一个分类问题,选取症状成分的构成特征、词典特征以及通用特征作为分类算法的特征;基于多种分类算法训练模型,将症状间的关系分为上下位关系和非上下位关系.实验结果表明,当选用支持向量机算法,同时选用三类特征时,取得了最好的效果,准确率、召回率和F1值分别达到了82.68％、82.13％和82.40％.在此基础上,使用所提出的关系抽取算法,抽取了20619条上下位关系,构建了具有上下位关系的症状知识库.%Since the hyponymy between symptoms has strong structural features,an automatic hyponymy extracting method based on symptom components was proposed.Firstly,it was found that symptoms can be divided into eight parts:atomic symptoms,adjunct words,and so on,and the composition of these parts satisfied certain constructed rules.Then,the lexical analysis system and Conditional Random Field (CRF) model were used to segment symptoms and label the parts of speech.Finally,the hyponymy extraction was considered as a classification problem.Symptom constitution features,dictionary features and general features were selected as the features of different classification algorithms to train the models.The relationship between symptoms were divided into hyponymy and non-hyponymy.The experimental results show that when these features are selected simultaneously,precision,recall and F1-measure of Support Vector Machine (SVM) are up to 82.68％,82.13％ and 82.40％,respectively.On this basis,by using the above hyponymy extracting algorithm,20619 hyponymies were extracted,and the knowledge base of symptom hyponymy was built.

著录项

来源
《计算机应用》 |2017年第10期|2999-3005|共7页
作者
王婷; 王祺; 黄越圻; 殷亦超; 高炬;
展开▼
作者单位

华东理工大学信息科学与工程学院;

上海200237;

华东理工大学信息科学与工程学院;

上海200237;

华东理工大学信息科学与工程学院;

上海200237;

上海中医药大学附属曙光医院;

上海200021;

上海中医药大学附属曙光医院;

上海200021;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理;
关键词
上下位关系; 症状构成成分; 条件随机场; 关系分类; 支持向量机; 决策树; 朴素贝叶斯;

相似文献

中文文献
外文文献
专利

1. 基于模板的中文上下位关系抽取方法 [J] . 章岳 ,黄赛豪 ,陆凯华 . 计算机应用与软件 . 2022,第1期
2. 一种基于语义的上下位关系抽取方法 [J] . 陈金栋 ,肖仰华 . 计算机应用与软件 . 2019,第002期
3. 一种基于条件随机场的领域术语上下位关系获取方法 [J] . 黄毅 ,王庆林 ,刘禹 . 中南大学学报：自然科学版 . 2013,第S2期
4. 基于混合特征的上下位关系验证方法 [J] . 刘磊 ,曹存根 . 计算机工程 . 2008,第014期
5. 基于二分网络分析方法的学术文献关键词自动抽取方法研究 [J] . 李树青 ,曹杰 ,庄光光 . 情报学报 . 2016,第012期
6. 一种基于条件随机场的领域术语上下位关系获取方法 [C] . HUANG Yi ,黄毅 ,WANG Qinglin . 2013年中国智能自动化会议 . 2013
7. 中文上下位关系自动抽取技术研究 [A] . 陈松毅 . 2015

基于症状构成成分的上下位关系自动抽取方法

摘要

著录项

相似文献

相关主题

期刊订阅