基于动态时间规整的时序数据相似连接

周宁南; 张孝; 刘城山; 王珊

首页> 中文期刊> 《计算机学报》 >基于动态时间规整的时序数据相似连接

基于动态时间规整的时序数据相似连接

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

由于蕴含事物发展规律,时序数据上的数据挖掘正成为大数据决策的重要组成部分.作为时序数据挖掘的一种基本操作,时序数据相似连接可以找出给定相似度度量下的所有相似时序数据对.研究表明,动态时间规整(Dynamic Time Warping,DTW)正在文本挖掘、趋势预测等越来越多的科学与社会应用领域中成为时序数据上目前最佳的相似性度量方法.该文首次提出采用DTW作为相似性度量方法的时序数据相似连接问题.特别地,该文首次提出了基于阈值和基于Top-k的两种DTW度量上的时间序列相似连接任务.除了服务于进一步的时序数据挖掘算法,这两个任务还具有机器翻译、关联检测等广泛的直接应用.但是,直接的相似连接方法因为时序数据的规模大、DTW计算复杂性高而不能在实际中工作.尽管存在很多基于DTW的索引和上下界计算方法,这些工作主要关注DTW度量上的快速检索而非相似连接.因此,这些方法都假设存在一个固定的时序数据作为查询,并根据查询使用时间和空间复杂度很高的方法构建索引或进行预计算.但在文中的相似连接问题中,所有时序数据都是查询,因此这些方法的构建索引和预计算的时间比直接的相似连接方法需要的处理时间还长.为此,该文针对两种相似连接任务提出了两个基于DTW上下界的剪裁框架用于减少准确DTW相似性的计算次数.基于划分,该文为DTW度量设计了新颖的上下界计算方案.由于细粒度的划分带来上下界接近准确的DTW相似性但需要更长的计算时间,而粗粒度的划分需要更短的计算时间和与准确DTW相似性有较大差距的上下界,该文设计了基于二分查找的机制来自动找到合适的划分粒度,实现了整体的高处理性能.面对单机不能容纳全部时序数据和运行时间长的情况,该文将提出的两种相似连接处理框架利用MapReduce并行计算框架扩展到了分布式环境.该文在两个真实数据集上验证了文中提出的DTW相似连接在实际应用中的效果,并在真实与合成数据集上进行了充分的实验,验证了文中方法的高效性.

著录项

来源
《计算机学报》 |2018年第8期|1798-1813|共16页
作者
周宁南; 张孝; 刘城山; 王珊;
展开▼
作者单位

教育部数据工程与知识工程重点实验室(中国人民大学) 北京 100872;

中国人民大学信息学院北京 100872;

中国计算机学会(CCF);

展开▼
原文格式 PDF
正文语种 chi
中图分类程序设计、软件工程;
关键词
动态时间规整; 时序数据; 相似连接; 划分剪枝; 分布剪枝;

相似文献

中文文献
外文文献
专利

1. 基于二维离散傅立叶变换及形态相似距离的证券时序数据相似性搜索 [J] . 胡丹妮 . 信息技术与信息化 . 2020,第001期
2. 运用Sentinel-1A时序数据和动态时间规整算法提取稻虾田空间分布信息 [J] . 卢泽如 ,熊勤学 ,周雨顺 . 江苏农业科学 . 2020,第018期
3. 基于Walsh变换的时序数据相似性搜索 [J] . 崔保良 ,滕少华 ,崔振 . 计算机工程 . 2011,第008期
4. 基于DCT的时序数据相似性搜索 [J] . 崔振 ,任亚洲 ,王瑞 . 计算机应用 . 2007,第005期
5. 基于小波变换的时序数据相似性挖掘 [J] . 彭宏 . 西华大学学报（自然科学版） . 2005,第001期
6. 基于近似的时序数据相似搜索方法研究 [C] . 胡清华 ,于达仁 . 中国动力工程学会2006电站自动化信息化学术和技术交流年会 . 2006
7. 基于动态时间规整的时序数据相似度量方法研究 [A] . 孙茂斌 . 2020

基于动态时间规整的时序数据相似连接

摘要

著录项

相似文献

相关主题

期刊订阅