基于统计分布的中文专利自动分类方法研究

胡冰; 张建立

首页> 中文期刊> 《现代图书情报技术》 >基于统计分布的中文专利自动分类方法研究

基于统计分布的中文专利自动分类方法研究

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

传统的基于向量空间模型的文本自动分类算法没有考虑到特征词的类间分布情况及特征词在文本内部的位置分布情况,导致该算法用于专利分类时效果不佳。提出一种基于统计分布的中文专利自动分类方法。首先,统计出特征词的类间分布信息,引入类间分散度加权因子,突出分布类别少、出现频率高的特征词的权重;其次,结合专利文本的结构特点,引入位置权重因子,突出专利的法律特性和技术特性以及组成专利各元素内容的差异性。最后通过对比实验证明,该方法能够有效提高中文专利自动分类的效果。

著录项

来源
《现代图书情报技术》 |2013年第z1期|101-106|共6页
作者
胡冰; 张建立;
展开▼
作者单位

1. 西安电子科技大学经济与管理学院 2. 工业和信息化部电子科学技术情报研究所;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理;
关键词
统计分布; 专利自动分类; 加权因子;

相似文献

中文文献
外文文献
专利

1. 基于改进的kNN算法的中文网页自动分类方法研究 [J] . 胡燕 ,吴虎子 ,钟珞 . 武汉大学学报：工学版 . 2007,第4期
2. 基于FastText的专利文本自动分类方法研究 [J] . 谢剑芳 ,田英明 ,徐旭 . 仪器仪表标准化与计量 . 2020,第004期
3. 依据TRIZ发明原理的中文专利自动分类 [J] . 翟继强 ,王克奇 . 哈尔滨理工大学学报 . 2013,第003期
4. 中文专利文献自动分类 [J] . 陈志雄 ,曾辉 . 嘉应学院学报 . 2010,第002期
5. 一种无需语句分割的中文文档自动分类方法研究及实现 [J] . 何涛 ,黄国兴 . 计算机科学 . 2004,第012期
6. 基于TRIZ发明原理的中文专利自动分类研究 [C] . 翟继强 ,王克奇 . 2011年管理创新、信息技术与经济增长国际学术会议 . 2011
7. 中文专利自动分类特征选择与特征加权方法研究 [A] . 胡冰 . 2014

基于统计分布的中文专利自动分类方法研究

摘要

著录项

相似文献

相关主题

期刊订阅