首页> 中文会议>第十四届全国人机语音通讯学术会议 >多特征融合的维哈口语短文本分类

多特征融合的维哈口语短文本分类

页面导航

摘要
著录项
相似文献
相关主题

摘要

少数民族语言如维吾尔语、哈萨克语、乌兹别克语、柯尔克孜语等使用基本相同的字符,并且共用大量词汇,难以通过判断特殊字符来区分文种.而来自社交网络的口语文本因为长度短、噪声多以及不合语法,是相近语言识别的难题.提出了一种基于启发式特征的口语短文本分类方法,不需要专家知识和精心制作的规则,便可有效识别文种.为了解决训练数据不均衡问题,提出了两种适合不同需求的均衡策略.结合最大熵分类器,系统在短文本数据集上总体能达到95.1％的精确度.

著录项

来源
《第十四届全国人机语音通讯学术会议》|2017年|1-6|共6页
会议地点江苏连云港
作者
Junqing He; 何峻青; Xuemin Zhao; 赵学敏; Yonghong Yan; 颜永红;
展开▼
作者单位

中国中文信息学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类文字信息处理;
关键词
少数民族语言; 文种识别; 口语短文本; 分类管理; 启发式特征;

相似文献

中文文献
外文文献
专利

1. 融合LDA主题模型和二维卷积的短文本分类 [J] . 康宸 ,郑山红 ,李万龙 . 计算机应用与软件 . 2020,第011期
2. 基于多特征融合的汉英口语翻译自动评分方法研究 [J] . 王婧锦 . 现代科学仪器 . 2021,第002期
3. 多特征融合的英语口语考试自动评分系统的研究 [J] . 李艳玲 ,颜永红 . 电子与信息学报 . 2012,第009期
4. 面向维汉机器翻译的层次化多特征融合模型 [J] . 潘一荣 ,李晓 ,杨雅婷 . 厦门大学学报（自然科学版） . 2020,第002期
5. 多特征融合的三维模型识别与分割 [J] . 党吉圣 ,杨军 . 西安电子科技大学学报（自然科学版） . 2020,第004期
6. 多特征融合的超图降维方法GPU并行加速 [C] . HONG Chao-Qun ,洪朝群 ,CHEN Xu-Hui . 2014全国高性能计算学术年会 . 2014
7. 基于多特征融合的英语口语评价算法研究 [A] . 姚轶 . 2008

多特征融合的维哈口语短文本分类

摘要

著录项

相似文献

相关主题

期刊订阅