您现在的位置: 首页> 研究主题> 空间数据挖掘

空间数据挖掘

空间数据挖掘的相关文献在1999年到2022年内共计486篇,主要集中在自动化技术、计算机技术、测绘学、经济计划与管理 等领域,其中期刊论文418篇、会议论文64篇、专利文献644602篇;相关期刊222种,包括测绘与空间地理信息、测绘科学技术学报、地理空间信息等; 相关会议51种,包括2014中国城市规划信息化年会、中国环境科学学会2013年学术年会、第八届京港澳测绘技术交流会等;空间数据挖掘的相关文献由912位作者贡献,包括王丽珍、陈红梅、郭达志等。

空间数据挖掘—发文量

期刊论文>

论文:418 占比:0.06%

会议论文>

论文:64 占比:0.01%

专利文献>

论文:644602 占比:99.93%

总计:645084篇

空间数据挖掘—发文趋势图

空间数据挖掘

-研究学者

  • 王丽珍
  • 陈红梅
  • 郭达志
  • 方刚
  • 方涛
  • 贾泽露
  • 肖清
  • 周丽华
  • 何彬彬
  • 刘耀林
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 张绍雪; 王丽珍; 陈文和
    • 摘要: 空间并置(co-location)模式挖掘是指在大量的空间数据中发现一组空间特征的子集,这些特征的实例在地理空间中频繁并置出现.传统的空间并置模式挖掘算法通常采用逐阶递增的挖掘框架,从低阶模式开始生成候选模式并计算其参与度(空间并置模式的频繁性度量指标).虽然这种挖掘框架可以得到正确和完整的结果,但是带来的时间和空间开销非常大.此外传统方法对于空间并置模式的最小频繁性阈值较为敏感,当最小频繁性阈值改变时整个挖掘过程需要重新进行.因此,本文提出一种基于极大团和哈希表的空间并置模式挖掘算法CPM-MCHM(Co-location Pattern Mining based on Maximal Clique and Hash Map)来发现完整并且正确的频繁空间并置模式.CPM-MCHM算法不仅避免逐阶候选-测试框架带来的巨大开销问题,还降低了算法对最小频繁性阈值的敏感.首先,采用基于位运算的分区Bron–Kerbosch算法生成给定空间数据集的所有极大团,并将其存储在哈希表中.然后,提出一种两阶段挖掘框架计算所有模式的参与度并过滤所有频繁空间并置模式.最后,在真实和合成数据集上进行了大量的对比实验.与经典的传统算法和近两年内学者提出的两种算法相比,当实验数据的规模达到20万实例数时,本文提出的CPM-MCHM算法的挖掘时间和空间耗费分别降低了90%和70%以上,当实验数据量进一步加大时CPM-MCHM算法的优势更加明显.
    • 李德仁; 张过; 蒋永华; 沈欣; 刘伟玲
    • 摘要: 大数据时代已经到来,并且已经深入人类生活的方方面面。作为地球科学与信息科学交叉融合催生出的地球空间信息学,大数据时代的来临在为其提供更丰富的数据保障的同时,也带来数据存储、管理、分析和挖掘方面的新挑战,甚至造成了某种程度上的“数据爆炸”。从大数据视角,梳理了当前地球空间信息学涉及的地理信息系统、智慧城市、遥感大数据和空间数据挖掘4个核心领域的瓶颈和挑战;指出在大数据时代,地球空间信息学可为地球科学研究提供更加精准、实时的空间信息框架和更加智能高效的信息处理手段,从而服务于智慧城市、智慧地球建设和人类社会的可持续发展。而且,大数据时代下,地球空间信息学的发展面临着软件和硬件水平的双重考验。
    • 胡自松; 王丽珍; Vanha Tran; 周丽华; 陈文和
    • 摘要: 空间频繁并置模式(SPCP)是一组空间特征的子集,它们的实例在地理空间中频繁地出现在一起。基于内存物化实例邻近关系并搜索模式实例效率较高,但实例信息会被重复存储。图数据库技术能高效地对具有复杂关联关系的数据建模,但基于实例邻近关系图移植已有的挖掘方法不能发挥图遍历的优势。针对上述问题,探索了基于图数据库的空间频繁并置模式挖掘方法。首先,利用图数据库对空间实例及其邻近关系建模,即将实例和关系存储在图数据库中。然后,基于图数据库设计了一个称为子图(团)搜索的基本算法,采用团查找的方式生成模式的表实例从而获得参与实例,避免了传统方法中效率较低的组合或连接操作。考虑到通过生成表实例收集参与实例的效率较低,设计了参与实例验证算法,包括过滤阶段和验证阶段。过滤阶段判断一个中心实例的邻居集中所涉及的特征是否完全包含了待计算模式中的特征,验证阶段则是判断是否存在一个模式实例包含该中心实例。参与实例验证算法每次验证一个中心实例都尽可能多地去确定参与对象,从而有效地减小了搜索空间和减少了团的搜索次数。此外,对提出算法的正确性和完备性进行了证明。最后,在真实和合成数据集上做了大量的实验,验证了所提算法的效率和有效性。
    • 方圆; 王丽珍; 王晓璇; 杨培忠
    • 摘要: 传统的空间并置模式挖掘旨在发现空间中实例频繁共存的特征子集.目前空间并置模式的大多数研究都将模式的频繁性作为兴趣度度量.然而,在实际应用场景中,用户往往不仅对特征集的频繁性感兴趣,而且对它的完整性也感兴趣.结合并置模式的频繁性和完整性,提出主导空间并置模式(dominant spatial co-location patterns,DSCPs),目的是为用户提供一组高质量的并置模式.具体地,在空间并置模式挖掘任务中引入了模式占有度,以衡量并置模式的完整性.我们通过同时考虑模式的完整性和频繁性形式化了主导并置模式挖掘的问题.设计了一个挖掘主导并置模式的基本算法,为了降低计算开销,提出了一系列的剪枝策略及新颖的数据结构改进基本算法的挖掘效率.在合成数据集和真实数据集上进行了实验,评估了所提出算法的效率和有效性,验证了剪枝策略能够大幅提高算法效率.在实际应用中的挖掘结果表明了主导并置模式挖掘的合理性和可用性.
    • 马董; 李新源; 陈红梅; 肖清
    • 摘要: 空间co-location模式是其实例在空间邻域内频繁并置出现的一组空间特征集。传统的空间co-location模式挖掘方法通常假设空间实例相互独立,并采用参与度作为模式有趣性的唯一度量指标,没有考虑不同特征或相同特征不同实例在空间邻域内所产生的影响差异,因此挖掘的结果往往缺乏相关性和可解释性。文中提出了一种星型高影响的空间co-location模式及挖掘方法,能够有效发现自身影响高且在邻域范围内也具有一定影响的空间co-location模式。首先,定义了度量模式影响的两个指标:模式影响参与度和模式影响占有度。其次,提出了挖掘星型高影响co-location模式的基础挖掘算法和剪枝策略。最后,通过在大量的真实和合成数据集上进行实验,分析了挖掘算法的效率和挖掘效果。实验结果表明,所提出的星型高影响co-location模式的度量方法和挖掘算法能够挖掘出较强相关性的co-location模式。
    • 罗金; 王丽珍; 王晓璇; 肖清
    • 摘要: 空间数据挖掘旨在从空间数据库中发现和提取有价值的潜在知识.空间co-location(共存)模式挖掘一直以来都是空间数据挖掘领域的重要研究方向之一,其目的是发现一组频繁邻近出现的空间特征子集,而空间高效用co-location模式挖掘则考虑了特征的效用属性.二者在度量空间实例的邻近关系时一般都需要预先给定一个距离阈值d,挖掘算法的效率很受距离阈值d的影响,尤其对分布不均匀的数据集表现不好.另外,传统的空间高效用模式挖掘在分析评估模式的效用时,将模式中所有特征的效用值都计算到模式效用中是不合理的,如在国内5A级景区周围进行高收益商业项目的规划时,项目的预期收益本身不应包含景点的收益.基于上述问题,本文在空间高效用co-location模式挖掘过程中融入了空间k-近邻计算,使得空间实例之间的邻近关系更为客观、合理.进一步地,定义了核元素和核模式等概念,对核模式效用的高低进行了度量,并提出了k-近邻关系下的空间高效用核模式挖掘的通用框架,设计了一个行之有效的基本挖掘算法,考虑到核模式效用度不满足反单调性质,在基本算法之上提出了4个剪枝策略.大量的实验结果表明本文方法挖掘到的空间高效用核模式更具有现实意义,在同等的参数设置下,剪枝优化算法的效率比基本算法至少提高了50%.
    • 潘燕
    • 摘要: 为降低煤矿能源开采风险,实现规范化管理,提出空间数据挖掘算法在煤矿能源保护监管中的应用研究。由信息层、控制层和设备层构成监管系统,明确系统职责,结合监管系统特征,设计空间数据挖掘模型整体结构。将粗糙集和神经网络方法相结合,去除冗余数据,采用误差函数和代价函数,确定神经网络训练样本数量。探究数据挖掘模型在煤矿保护监管中的应用过程,设计神经网络结构,计算神经元数量,反复训练网络生成关联规则。经过实例应用分析,从关联规则中可得出:煤矿能源安全和瓦斯浓度、日开采量之间支持度较高,必须将二者指标控制在合理范围内。由此证明了挖掘算法不但可以获取煤矿能源现状,还能通过历史数据得出预见性结论。
    • 王佳媛
    • 摘要: 传统遥感图像测绘方法存在图像分辨率较低的问题,为此,提出一种基于空间数据挖掘的遥感图像立体测绘方法。首先,利用卫星获取遥感影像,根据立体测绘需求,在指定区域布控测点;然后,通过空间数据挖掘对遥感图像进行分类处理,通过决策树确定正例集和反例集消息源,明确期望信息;最后,选择MapMatrix软件导入遥感图像期望信息,恢复遥感图像三维结构,通过空间数据挖掘,实现遥感图像立体测绘。实验结果表明:设计的遥感图像立体测绘方法,在实际应用中可提高图像连续点分辨率,保证图像具有较高的平滑性。
    • 孙雅琴
    • 摘要: 21世纪,科学研究进入第四范式:数据密集型科学发现的时代。数据已经成为新时代重要的生产要素、国家基础性战略资源。美国、俄罗斯、法国、日本,以及中国,先后发射了大量的卫星,每天接收海量的遥感卫星数据。还有无所不在的传感网数据,带有全球导航定位的车辆轨迹数据等,积累了海量的时空大数据。时空大数据时代的到来,给遥感与地理信息创新带来了各种挑战和机遇。
    • 邹目权; 王丽珍; 吴萍萍; 杨培忠
    • 摘要: 飞速发展的物联网技术不断催生海量带有时间和空间属性的数据集.这些数据集掀起了以空间co-location模式挖掘为代表的空间数据挖掘研究的高潮.传统空间co-location模式挖掘研究主要发现空间中频繁并置出现的特征的子集.特征在模式内部是无序的,特征之间的地位是平等的.例如,co-location模式{看守所,刑警中队,武警中队}表示看守所附近往往存在刑警中队和武警中队,反之亦然.然而,由于空间分布密度差异显著存在,现实中存在特征地位不平等的模式,这些模式中的某些特征(核特征)附近频繁地出现其它特征(非核特征)的实例,而这些非核特征附近不一定频繁地出现核特征的实例.例如,某些肿瘤疾病与某些污染源的关系.在传统模型中,用户为了发现感兴趣的模式不得不将频繁性阈值设置得很低,以至于忽略了模式中特征的主从关系.本文聚焦于前述现象,研究在空间数据集中挖掘核特征与非核特征组成的有趣模式.首先,基于核邻居定义空间co-location核频繁模式(简称核模式)的概念.核邻居与最近邻息息相关,它不仅遵从地理学第一定律而且能排除无关实例的干扰.其次,提出核模式的有趣性度量理论,分析核模式具有的性质,如基于核参与率反单调性的先验原理等.再次,提出基于Voronoi图的核邻居计算思想,避免了传统co-location模式挖掘中为计算邻近关系需要用户预先设定距离阈值等问题.同时,扩展传统的对称的空间邻近关系到不对称的核邻居关系,使其与特征的不平等地位相适应.此外,针对点、线、面等不同几何形状的空间实例,提出基于凹包理论的经典Voronoi图的扩展方法.最后,在合成数据与真实数据上对比验证了Core Pattern Mining(CPM)算法的效果与效率.实验高效地发现了有别于经典co-location模式的有趣模式,它们具有可理解性.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号