首页> 中文会议>2007年全国网络与信息安全技术研讨会 >大规模语料的频繁模式快速发现算法

大规模语料的频繁模式快速发现算法

页面导航

摘要
著录项
相似文献
相关主题

摘要

已有基于内存的频繁模式发现算法需要的物理内存是语料规模的几倍甚至几十倍,本文提出一种大规模语料频繁模式快速发现算法,通过采用合适的策略将语料划分为若干子语料,对每个子语料单独进行处理,即可获得原始语料的频繁模式;同时该算法能够避免处理频次在设定阈值以下的模式,进一步减少了内存占用,提高了处理速度。实验表明,对3.6G互联网新闻语料发现频次大于100的所有频繁模式中最高消耗内存为1.6G,单机平均每秒处理文本语料3.28M。

著录项

来源
《2007年全国网络与信息安全技术研讨会》|2007年|281-287|共7页
会议地点青岛
作者
龚才春; 中国科学院研究生院; 贺敏; 中国科学院研究生院; 张华平; 许洪波; 程学旗;
展开▼
作者单位

中国通信学会;

中国互联网协会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类检索机;
关键词
频繁模式; 语料划分; 物理内存; 快速发现算法;

相似文献

中文文献
外文文献
专利

1. 大规模语料的频繁模式快速发现算法 [J] . 龚才春 ,贺敏 ,陈海强 . 通信学报 . 2007,第012期
2. 大规模语料中频繁模式增量发现算法 [J] . 廖豪 ,陈洁 ,谭建龙 . 计算机工程 . 2011,第023期
3. 基于大规模语料划分的频繁模式查找算法 [J] . 丁溪源 ,黄河燕 ,张海军 . 计算机科学 . 2012,第003期
4. 基于大规模语料的新词发现算法 [J] . 顾森 . 程序员 . 2012,第007期
5. 大规模复杂网络中的社团快速发现算法 [J] . 刘波涛 . 科技通报 . 2012,第8期
6. 一种改进的快速频繁模式挖掘算法 [C] . ZHOU Shunxian ,周顺先 . 第22届全国计算机新科技与计算机教育学术会议 . 2011
7. 基于大规模网络语料的中文新词发现技术研究 [A] . 伍午阳 . 2017

大规模语料的频繁模式快速发现算法

摘要

著录项

相似文献

相关主题

期刊订阅