一种不需分词的中文文本分类方法

许云; 樊孝忠; 张锋

首页> 中文期刊> 《北京理工大学学报》 >一种不需分词的中文文本分类方法

一种不需分词的中文文本分类方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

提出了一种不需分词的n元语法文本分类方法.与传统文本分类模型相比,该方法在字的级别上利用了n元语法模型,文本分类时无需进行分词,并且避免了可能造成有用信息丢失的特征选择过程.由于字的数量远小于词的数量,所以该分类方法与其它在词级别上的分类方法相比,有效地降低了数据稀疏带来的影响.系统地研究了模型中的关键因素以及它们对分类结果的影响.使用中文TREC提供的数据进行实验,结果表明,综合评价指标Fβ=1达到86.8%.

著录项

来源
《北京理工大学学报》 |2005年第9期|778-781|共4页
作者
许云; 樊孝忠; 张锋;
展开▼
作者单位

北京理工大学信息科学技术学院计算机科学工程系;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
文本分类; 分词; n元语法模型;

相似文献

中文文献
外文文献
专利

1. 用于中文文本分类的基于类别区分词的特征选择方法 [J] . 周奇年 ,张振浩 ,徐登彩 . 计算机应用与软件 . 2013,第003期
2. 基于字符串核的免分词中文文本分类方法 [J] . 游智 ,李战怀 ,张阳 . 计算机工程与应用 . 2006,第026期
3. 基于中文文本分类的分词方法研究 [J] . 湛燕 ,陈昊 ,袁方 . 计算机工程与应用 . 2003,第023期
4. 一种基于中文文本分类技术的计算机辅助密级界定方法 [J] . 潘娅 . 电子测试 . 2016,第006期
5. 中文文本分类中一种基于语义的特征降维方法 [J] . 胡涛 ,刘怀亮 . 现代情报 . 2011,第011期
6. 一种面向统计机器翻译的中文分词自适应方法 [C] . . 第四届全国机器翻译研讨会 . 2008
7. 一种中文文本分类方法的研究及实现 [A] . 张洁 . 2006

一种不需分词的中文文本分类方法

摘要

著录项

相似文献

相关主题

期刊订阅