首页> 中文会议>第二届全国信息检索与内容安全学术会议 >一个基于最大熵模型的文本分类方法

一个基于最大熵模型的文本分类方法

页面导航

摘要
著录项
相似文献
相关主题

摘要

本文提出了一种应用最大熵模型进行中文文本分类的方法,该方法重点在于特征函数的构建和文本的预处理这两个方面.本文把文档的预处理分为网页去标记、分词、去虚词和去停用词四个步骤,从而使得特征项的提取更加合理.另外,本文提出了一种基于特征模板的方法,并将其与特征项的权重相结合的特征函数构建方法,提高了分类器的分类精度.实验结果发现,基于特征模板和权重相结合的最大熵模型的微平均准确率达到96.67％,分类效果要好于基于词频的最大熵模型.

著录项

来源
《第二届全国信息检索与内容安全学术会议》|2005年|172-179|共8页
会议地点北京
作者
李军辉; 朱巧明; 李培峰;
展开▼
作者单位

中国中文信息学会;

中国科学院计算机技术研究所;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类程序设计、软件工程;信息处理（信息加工）;
关键词
文本分类; 最大熵模型; 文本预处理; 特征模板; 特征函数;

相似文献

中文文献
外文文献
专利

1. 一种基于改进信息增益特征选择的最大熵模型文本分类方法 [J] . 何明 . 西南师范大学学报（自然科学版） . 2019,第003期
2. 基于最大熵模型的藏文不良文本识别系统的设计和实现 [J] . 仁青诺布 ,苏亚超 ,孙亚东 . 西藏科技 . 2014,第003期
3. 基于特征缺失补偿最大熵模型的文本分类 [J] . 祁瑞华 ,杨德礼 ,胡润波 . 情报杂志 . 2010,第005期
4. 基于最大熵模型的不良文本识别 [J] . 高峰 ,张永奎 . 电脑开发与应用 . 2009,第001期
5. 使用最大熵模型进行中文文本分类 [J] . 李荣陆 ,王建会 ,陈晓云 . 计算机研究与发展 . 2005,第001期
6. 基于文本团的自动文本分类方法 [C] . 胡晓辉 ,王明文 ,叶浩 . 全国第四届Web信息系统及其应用学术会议、全国第二届语义Web与本体论学术研讨会、全国电子政务技术与办公自动化学术研讨会 . 2007
7. 基于最大熵模型的不良文本识别方法研究 [A] . 高峰 . 2009

一个基于最大熵模型的文本分类方法

摘要

著录项

相似文献

相关主题

期刊订阅