Parallel Frequent Dataset Mining and Feature Subset Selection for High Dimensional Data on Hadoop using Map-Reduce

Sandhya S. Waghere; Pothuraju Rajarajeswari

首页> 外文期刊>International Journal of Applied Engineering Research >Parallel Frequent Dataset Mining and Feature Subset Selection for High Dimensional Data on Hadoop using Map-Reduce

【24h】

Parallel Frequent Dataset Mining and Feature Subset Selection for High Dimensional Data on Hadoop using Map-Reduce

机译：使用Map-Refey对Hadoop上的高维数据的并行频繁数据集挖掘和功能子集选择

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Data mining mostly use for information analysis and finding frequent dataset. Now a days cloud computing is used for information storage and many other data processes like data mining, data retrieval, data distribution etc. As data increasing very rapidly on server day by day, many complications are introduced. Most common problems are load balancing on server and time optimization. To overcome these limitations parallel frequent dataset mining is very effective method. Fidoop parallel frequent dataset mining algorithm which is based on mapreduce framework helps to improve load balancing and FiDoop-HD, speed up the mining performance for high-dimensional data analysis. Fidoop is very efficient and scalable algorithm for large clusters of data. We are using Fast Clustering Based Feature Selection Algorithm for High Dimensional Data which uses minimum spanning tree (MST) to divide data into different clusters and unfasten unrelated sets and gives accurate and efficient result with similar sets.

机译：数据挖掘主要用于信息分析并找到频繁的数据集。现在，云计算用于信息存储和数据挖掘，数据检索，数据分布等的许多其他数据流程，因为数据在日常服务器上快速增长，介绍了许多并发症。最常见的问题是服务器和时间优化的负载平衡。为了克服这些限制，并行频繁的数据集挖掘是非常有效的方法。 Fidoop并行频繁数据集采用基于MapReduce框架的DataSet挖掘算法有助于提高负载平衡和FIDOP-HD，加快采矿性能进行高维数据分析。 Fidoop是用于大型数据集群的非常高效且可扩展的算法。我们正在使用基于快速聚类的特征选择算法，用于使用最小的生成树（MST）将数据划分为不同的集群，并解开具有相似集的准确和有效的结果。

著录项

来源
《International Journal of Applied Engineering Research》 |2017年第5期|共7页
作者
Sandhya S. Waghere; Pothuraju Rajarajeswari;
展开▼
作者单位

Department of Computer Science and Engineering K L University;

Department of Computer Science and Engineering K L University;

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类工程基础科学;
关键词
Frequent item sets; Frequent Items Ultrametric trees; Hadoop; MapReduce;

机译：频繁的项目集;频繁的物品超微树木;hadoop;mapreduce;

相似文献

外文文献
中文文献
专利

1. Parallel Frequent Dataset Mining and Feature Subset Selection for High Dimensional Data on Hadoop using Map-Reduce [J] . Sandhya S. Waghere, Pothuraju Rajarajeswari International Journal of Applied Engineering Research . 2017,第18aPta5期

机译：使用Map-Refey对Hadoop上的高维数据的并行频繁数据集挖掘和功能子集选择
2. A hybrid algorithm for feature subset selection in high-dimensional datasets using FICA and IWSSr algorithm [J] . Moradkhani Mostafa, Amiri Ali, Javaherian Mohsen, Applied Soft Computing . 2015,第Null期

机译：FICA和IWSSr算法在高维数据集中特征子集选择的混合算法
3. Fast wrapper feature subset selection in high-dimensional datasets by means of filter re-ranking [J] . Pablo Bermejo, Luis de la Ossa, Jose A. Gamez, Knowledge-Based Systems . 2012,第1期

机译：通过过滤器重新排序在高维数据集中快速包装特征子集选择
4. Markov blanket: Efficient strategy for feature subset selection method for high dimensional microarray cancer datasets [C] . Kalpdrum Passi, Abdala Nour, Chakresh Kumar Jain IEEE International Conference on Bioinformatics and Biomedicine . 2017

机译：Markov橡皮布：高维微阵列癌症数据集特征子集选择方法的有效策略
5. Robust and efficient feature selection for high-dimensional datasets. [D] . Mo, Dengyao. 2011

机译：高维数据集的稳健而高效的特征选择。
6. An Efficient Feature Subset Selection Algorithm for Classification of Multidimensional Dataset [O] . Senthilkumar Devaraj, S. Paulraj 2015

机译：多维数据集分类的有效特征子集选择算法
7. Mining of High Dimensional Data using Efficient Feature Subset Selection Clustering Algorithm (WEKA) [O] . Lakshmi Sarika T, B Tarakeswara Rao, Ph. D, 2015

机译：使用高效特征子集选择聚类算法（WEKa）挖掘高维数据
8. Data Mining Feature Subset Weighting and Selection Using Genetic Algorithms [R] . 2002

机译：基于遗传算法的数据挖掘特征子集加权和选择

Parallel Frequent Dataset Mining and Feature Subset Selection for High Dimensional Data on Hadoop using Map-Reduce

摘要

著录项

相似文献

相关主题

期刊订阅