采用半随机特征采样算法的中文书写纹识别研究

黎冬媛; 刘智; 刘三(蚜); 孟文婷

首页> 中文期刊> 《计算机科学》 >采用半随机特征采样算法的中文书写纹识别研究

采用半随机特征采样算法的中文书写纹识别研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

N-gram字符序列能有效捕捉文本中作者的个体风格信息,但其特征空间稀疏度高,且存在较多噪音特征.针对该问题,提出一种基于半随机特征采样的中文书写纹识别算法.该算法首先采用一种离散度准则为每个作者选取一定粒度的个体特征集,然后将个体特征集以一种半随机选择机制划分成多个等维度的特征子空间,并基于每个子空间训练相应的基分类器,最后采取多数投票法的融合策略构造集成分类模型.在中文真实数据集上与基于随机子空间和Bagging算法的集成分类器进行了对比试验,结果表明,该算法在正确率和差异度方面优于随机子空间和Bag-ging算法,并且取得了比单分类模型更好的识别性能.%Character N-gram can be used to effectively capture individual-author stylistic information in texts. To deal with the problems of high-sparsity and high-redundancy in the feature spaceman ensemble classification algorithm based on semi-random feature sampling was proposed in this study. Firstly, the whole feature space is divided into several individual-author feature sets by a divergence rule. Then each of them is divided into equally sized subspaces by a semi-random selection method,and a base classifier is trained on each random subspace. Finally, these base classifiers are combined to construct an ensemble via the majority voting method. To examine the algorithm, the experiment was conducted on a real-life dataset. It is observes that the algorithm achieved a considerable improvement in accuracy and robustness compared with the benchmark technique in Chinese writeprint identification (random subspace method, bagging and support vector machine).

著录项

来源
《计算机科学》 |2013年第2期|120-123152|共5页
作者
黎冬媛; 刘智; 刘三(蚜); 孟文婷;
展开▼
作者单位

电子科技大学中山学院计算机学院中山528402;

华中师范大学国家数字化学习工程技术研究中心武汉430079;

华中师范大学国家数字化学习工程技术研究中心武汉430079;

华中师范大学计算机科学系武汉430079;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
书写纹; 半随机特征采样; 个体特征集; 集成分类器; 差异度;

相似文献

中文文献
外文文献
专利

1. 基于多元概率推理模型的中文书写纹识别 [J] . 刘三女牙 ,铁璐 ,刘智 . 计算机工程 . 2013,第011期
2. 基于集成学习与遗传算法的网络书写纹识别研究 [J] . 孙建文 ,杨宗凯 ,刘三(蚜) . 计算机科学 . 2011,第006期
3. 随机采样子空间保局投影人脸识别算法 [J] . 杨利平 ,龚卫国 ,李伟红 . 光学精密工程 . 2008,第008期
4. 联合均等采样随机擦除和全局时间特征池化的视频行人重识别方法 [J] . 陈莉 ,王洪元 ,张云鹏 . 计算机应用 . 2021,第001期
5. 一种随机采样的特征保持的网格简化算法 [J] . 赵晔 ,周畅 ,王昌 . 计算机科学 . 2011,第005期
6. 基于条件随机场的中文命名实体识别特征比较研究 [C] . . 第四届全国信息检索与内容安全学术会议 . 2008
7. 基于集成特征选择的网络书写纹识别研究 [A] . 孙建文 . 2011

采用半随机特征采样算法的中文书写纹识别研究

摘要

著录项

相似文献

相关主题

期刊订阅