Dept. of Computer Science Engineering, Shanghai Jiao Tong University, Chinac;
Chinese document; Hamming distance; near-duplicate; online detection; simhash;
机译:基于指纹的近重复文档检测及其在SNS垃圾邮件检测中的应用
机译:通过OpenCL在几乎重复的文档检测中评估CPU,GPU和FPGA的效率
机译:通过OpenCL在几乎重复的文档检测中评估CPU,GPU和FPGA的效率
机译:用于检测中国近重复文件的在线系统
机译:挖掘弗吉尼亚市中国先驱者的无形过去:使用历史地理信息系统(HGIS)在蒙大纳州的一个采矿营地(1863年-20世纪中叶)中记录,可视化和解释中国人的空间历史。
机译:转录组学文件ZW性别决定系统辅助中华绒螯蟹的高密度连锁作图
机译:XNDDF:建立一种使用监督和无监督学习的灵活的近重复文档检测框架