基于主题模型的文本分类算法性能比较

王万起; 田中雨; 董兰军

首页> 中文期刊> 《高校图书馆工作》 >基于主题模型的文本分类算法性能比较

基于主题模型的文本分类算法性能比较

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

文章利用LDA模型进行文本降维和特征提取,并将传统分类算法置于集成学习框架下进行训练,以探讨是否能提高单一分类算法的分类准确度,并获得较优的分类效果,使LDA模型能够发挥更高的性能和效果,从而为文本分类精度的提高服务。同时,以Web of Science为数据来源,依据其学科类别划分标准,建立涵盖6个主题的实验文本集,利用Weka作为实验工具,以平均F值作为评价指标,对比分析了朴素贝叶斯、逻辑回归、支持向量机、K近邻算法4种传统分类算法以及AdaBoost、Bagging、Random Subspace 3种集成学习算法的分类效果。从总体上看,通过“同质集成”集成后的文本分类准确率高于单个分类器的分类准确率;利用LDA模型进行文本降维和特征提取,将朴素贝叶斯作为基分类器,并利用Bagging进行集成训练,分类效果最优,实现了“全局最优”。

著录项

来源
《高校图书馆工作》 |2022年第2期|41-46|共6页
作者
王万起; 田中雨; 董兰军;
展开▼
作者单位

辽宁工程技术大学图书馆;

中国科学院大学经济与管理学院图书情报与档案管理系;

展开▼
原文格式 PDF
正文语种 chi
中图分类文献标引与编目;
关键词
文本分类; 集成学习; 算法比较; F值; 主题模型;

相似文献

中文文献
外文文献
专利

1. 几种文本分类算法性能比较与分析 [J] . 杨娟 ,王未央 . 现代计算机（专业版） . 2016,第025期
2. 几种常用文本分类算法性能比较与分析 [J] . 卢苇 ,彭雅 . 湖南大学学报（自然科学版） . 2007,第006期
3. 基于词典和文本分类算法的中医药文本情感分析研究 [J] . 姚家琦 ,刘伟 ,吴若峰 . 电脑编程技巧与维护 . 2022,第4期
4. 基于共有文本特征词跨类联合分类的电力文本分类算法研究 [J] . 王琼 ,杨波 ,陈佐虎 . 电子技术与软件工程 . 2021,第007期
5. LDA模型下文本自动分类算法比较研究——基于网页和图书期刊等数字文本资源的对比 [J] . 李湘东 ,潘练 . 信息资源管理学报 . 2015,第004期
6. 基于主题模型的古典乐器诗词文本挖掘 [C] . SHEN Zizhuo ,申资卓 ,YANG Ying . 第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会（CCL 2018） . 2018
7. 基于多粒度主题模型的短文本分类算法研究 [A] . 谢涛 . 2019

基于主题模型的文本分类算法性能比较

摘要

著录项

相似文献

相关主题

期刊订阅