一种基于文本相似度矩阵运算的非结构化海量投诉数据分类算法

李青; 陈阳; 谢浩然; 蒙圣光

首页> 中文期刊> 《计算机工程与科学》 >一种基于文本相似度矩阵运算的非结构化海量投诉数据分类算法

一种基于文本相似度矩阵运算的非结构化海量投诉数据分类算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

With the fast development of the Internet and information technology nowadays, the growth of the volume of unstructured data is exponential. In particular, the prevalence of the Web 2. 0 network community further enlarges the growth tendency. Therefore, how to manage and organize large-scale unstructured data effectively, so as to facilitate end-user information access, becomes an urgent and important research topic. In this paper, based on the text of unstructured data modeling and text similarity, the existing large-scale unstructured data classification algorithms are surveyed and discussed, and they are applied to a China Mobile user complaint data classification system. Upon the latter, the effectiveness of processing the complaint data is shown to have been much improved, and the usage of our proposed classification algorithm and system architecture is verified.%随着互联网和信息技术的日新月异,非结构化数据量有呈几何级数增长的趋势.尤其是Web 2.0网络社区的流行与火爆,使得增长趋势得到了进一步的加速.因此,面对海量的非结构化数据,如何有效地管理和组织它们,以便于终端用户进行信息存取,成为了一个迫在眉睫的重要研究课题.本文通过对非结构化数据的文本的建模和文本相似度比较,对于大规模非结构化数据的分类算法进行了讨论和研究,并将此算法应用到了中国移动的投诉数据分类系统中.在系统实施后,非常有效地提高了投诉数据的处理效率,从而印证所提出分类算法及系统框架的有效性.

著录项

来源
《计算机工程与科学》 |2012年第1期|103-107|共5页
作者
李青; 陈阳; 谢浩然; 蒙圣光;
展开▼
作者单位

香港城市大学计算机科学系;

香港九龙塘999077;

中国移动通信集团广西有限公司;

广西南宁530000;

香港城市大学计算机科学系;

香港九龙塘999077;

珠海市发思特软件技术有限公司;

广东珠海519080;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
文本相似度; 非结构化数据; 投诉数据分类系统;

相似文献

中文文献
外文文献
专利

1. 非结构化海量变电工程数据分类算法设计 [J] . 任重 . 自动化应用 . 2021,第002期
2. 一种基于MongoDB和Hadoop的海量非结构化物联网数据处理方案 [J] . 杨鹏 ,林俊晖 . 微电子学与计算机 . 2018,第4期
3. 基于数据库抽样的海量数据分类算法研究 [J] . 李雪婵 . 计算机科学 . 2008,第006期
4. 新闻采编中的海量非结构化数据的基于时空信息的编码管理 [J] . 胡斌 ,傅新宇 . 中国传媒科技 . 2013,第007期
5. 新闻采编中的海量非结构化数据的基于时空信息的编码管理 [J] . 胡斌 ,傅新宇 . 中国传媒科技 . 2013,第013期
6. 基于E2LSH的海量非结构化数据元组快速归约方法 [C] . CHEN Jun-yue ,陈俊月 ,HAO Wen-ning . 2017中国系统仿真与虚拟现实技术高层论坛 . 2017
7. 基于海量数据挖掘的分类算法研究 [A] . 涂敬伟 . 2015

一种基于文本相似度矩阵运算的非结构化海量投诉数据分类算法

摘要

著录项

相似文献

相关主题

期刊订阅