藏文文本分类特征基元选择

才智杰; 道吉扎西

首页> 中文期刊> 《中文信息学报》 >藏文文本分类特征基元选择

藏文文本分类特征基元选择

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

文本分类是指根据预先定义的主题类别,按照一定的规则将文档集合中未知类别的文档按内容自动确定某种类别的技术,是自然语言处理中最基本、最重要的研究内容之一,在信息检索、智能推荐、舆情分析、新闻分类等领域具有极高的应用价值。现阶段,藏文文本分类的主要研究集中在借用英汉等语言文本分类技术构建分类器,英汉等语言以词做分类特征基元构建分类器。由于受藏文分词技术制约,直接以词做藏文文本分类特征基元,其性能有较大的影响。该文在分析文本分类流程及藏文文本构成的基础上,研究了藏文文本分类特征基元选择方法,提出了一种融合词和音节的藏文文本分类特征基元选择方法,并以CNN模型构建的分类器验证了该方法的有效性。

著录项

来源
《中文信息学报》 |2023年第1期|64-70|共7页
作者
才智杰; 道吉扎西;
展开▼
作者单位

青海师范大学计算机学院;

省部共建藏语智能信息处理及应用国家重点实验室;

西藏大学信息科学技术学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
自然语言处理; 藏文; 基元; 文本分类;

相似文献

中文文献
外文文献
专利

1. 使用概念基元特征进行自动文本分类 [J] . 贾宁 . 计算机工程与应用 . 2007,第001期
2. 基于特征贡献度的特征选择方法在文本分类中应用 [J] . 孟佳娜 ,林鸿飞 ,李彦鹏 . 大连理工大学学报 . 2011,第004期
3. 基于类别特征域的文本分类特征选择方法 [J] . 赵世奇 ,张宇 ,刘挺 . 中文信息学报 . 2005,第6期
4. 一种多基元联合训练的藏文词向量表示方法 [J] . 才智杰 ,才让卓玛 ,孙茂松 . 中文信息学报 . 2020,第005期
5. 多元图图形基元和特征基元提取与表示方法 [J] . 洪文学 ,高海波 ,崔建新 . 燕山大学学报 . 2008,第005期
6. 基于词性特征提取的藏文文本分类方法研究 [C] . 贾会强 ,刘晓丽 ,于洪志 . 2011年中国计算机学会服务计算学术会议(CCF NCSC2011) . 2011
7. 基于卷积神经网络的特征选择和特征表示文本分类研究 [A] . 高梦园 . 2019

藏文文本分类特征基元选择

摘要

著录项

相似文献

相关主题

期刊订阅