一种基于N-Gram技术的中文文献自动分类方法

何浩; 杨海棠

首页> 中文期刊> 《情报学报》 >一种基于N-Gram技术的中文文献自动分类方法

一种基于N-Gram技术的中文文献自动分类方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

本文介绍一种基于n-gram技术的、与语言无关的文献分类方法K-means axiales (KMA),及其在中文文献自动分类中的应用.这种方法将文献转换成由n-gram(n个连续的字符)频次构成的向量.为压缩存储空间、提高处理速度,我们运用哈希函数将n-gram映射为哈希码,对文献的分析实际上以哈希码频次为基础运行.采用KMA算法,我们对一个中文数据库进行了自动分类的实验研究,在比较实验结果的基础上,我们对KMA算法初始参数的选择进行了初步探讨.

著录项

来源
《情报学报》 |2002年第4期|421-427|共7页
作者
何浩; 杨海棠;
展开▼
作者单位

华中师范大学信息管理系;

武汉;

430079;

华中师范大学信息管理系;

武汉;

430079;

展开▼
原文格式 PDF
正文语种 chi
中图分类图书馆学、图书馆事业;
关键词
n-gram 汉字切分哈希码文献向量 KMA 自动分类;

相似文献

中文文献
外文文献
专利

1. 一种基于N-Gram的计算机病毒特征码自动提取方法 [J] . 曾键 ,赵辉 . 计算机安全 . 2013,第010期
2. OpenE:一种基于n-gram共现的自动机器翻译评测方法 [J] . 孙连恒 ,杨莹 ,姚天顺 . 中文信息学报 . 2004,第002期
3. 基于n-gram多特征的流量载荷类型分类方法 [J] . 丁杰 ,黄亮 ,庹宇鹏 . 计算机应用与软件 . 2017,第002期
4. 一种基于图像分类的航空紧固件产品自动分类方法 [J] . 胡京徽 ,许鹏 . 计算机科学 . 2021,第0z1期
5. 一种基于迁移学习的栅格型图表自动分类方法 [J] . 韩冰 ,王光霞 ,陈令羽 . 测绘科学技术学报 . 2021,第001期
6. 一种基于小波变换的地形自动分类方法 [C] . 吴刚 ,Veronique Prinet ,Hong Wei . 2003全国数字媒体与数字城市学术会议 . 2003
7. 基于TextRank算法的中文文献自动摘要提取研究 [A] . 赵君 . 2019

一种基于N-Gram技术的中文文献自动分类方法

摘要

著录项

相似文献

相关主题

期刊订阅