机译:基于MapReduce和HDFS的重复数据检测方法
deduplication; MapReduce; Large scale data sets; shared nearest neighbor; HDFS; Simhash;
机译:基于MapReduce和HDFS的重复数据检测方法
机译:使用基于令牌的数据仓库方法检测和消除重复数据:一种基于聚类的方法
机译:使用基于令牌的数据仓库方法检测和消除重复数据:一种基于聚类的方法
机译:一种基于RDBMS的高效重复数据检测方法
机译:在线数据流上的新型类检测和跨语言重复检测
机译:使用信息理论方法从时间序列微阵列数据推断基因调控网络的MapReduce算法
机译:AES - MR:使用MapReduce保护HDFS环境中的数据的新加密方案