GIS空间数据分析中的分类变量相似度研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着空间数据采集技术和数据分析技术的快速进步，GIS在多源数据融合和语义信息分析等领域形成了新的研究热点，使得空间数据分析对人和社会活动进行描述的能力获得了极大的加强。GIS空间数据分析对社会空间、行为地理和城市空间结构分析等领域的研究产生了积极的促进作用。
　　空间数据中包含大量的分类变量，例如地名和空间对象的属性中描述性的内容，提取分类变量中包含的语义信息对于空间数据分析非常重要。当前主流的语义关系分析方法包括基于频率的相似度度量方法、基于本体的相似度度量方法和基于概率语言模型的相似度度量方法三种。对GIS空间数据分析而言，基于频率的相似度度量方法适合处理关系数据库，但是精确度较低且测度性能也不理想;基于本体的相似度度量方法受可用本体的限制，多数集中在检索与匹配类的应用，难以扩展到其他领域;基于概率语言模型的相似度度量因为需要大量的训练数据，所以很难在一般规模的数据集上有效应用。此外，由于空间数据分析常见于地学、计算机科学与相关学科的跨学科研究，其研究问题、测试数据与解决方法之间相结合的难度很大，所以现有的相似度度量与空间数据分析的结合也面临很大挑战。
　　针对GIS空间数据分析中面临的缺乏既适用于结构化数据又能处理包含复杂数据类型多源数据的语义相似度度量方法的问题，提出了两种新的相似度度量方法，并将新方法应用于空间结构分析问题中，取得了良好的效果。主要创新性研究成果包括以下三个方面:
　　(1)针对基于频率的相似度度量方法准确度较差的问题，通过借鉴朴素贝叶斯分类器的分类思想提出一种基于朴素近似熵的分类变量相似度。该方法首先在生成模型的基础上构建代表分类变量的数据子集，并基于子集中数据对象的朴素近似熵构建代表分类变量的特征向量，最后计算特征向量间的距离作为分类变量间的相似度。通过在公共数据集上的实验验证，单独使用或代入k-modes聚类算法替代原有的相似度度量时，性能均优于现有方法。
　　(2)针对一部分表达精度较好的相似度方法作为测度无法满足对称性和三角不等式要求的问题，以概率语言模型中的分布假设为基础提出一种基于分布差异的Hellinger距离相似度度量方法。该方法用Hellinger距离来表示不同分类变量所包含的同一属性间的分布差异，然后以差异作为元素来构造代表分类变量的特征向量，最后计算向量间的距离作为相似度。Hellinger距离不但在差异表达上有很好的精度，同时还满足测度性能上非负、对称和三角不等式的要求。实验结果表明，单独使用或代入k-modes聚类算法替代原有的相似度度量时，性能均优于现有方法，同时对不平衡数据集的适用性上也得到很大提高。
　　(3)针对语义分析方法与传统问题相结合存在较多困难的问题，将分类变量的语义相似度推广到数据对象之间的语义相似度，结合基于Hellinger距离的分类变量相似度提出一种基于语义相似度的商业空间特征提取与结构分析方法，利用从WebGIS上收集的互联网数据对城市商业空间结构进行分析。该方法通过计算并比较区域间的经济评价指数对城市商业空间结构进行描述，并以百度地图为数据来源，完成了对沈阳市商业空间结构的分析。分析结果不但验证了新提出的分类变量相似度度量方法，还扩展了空间数据分析与互联网空间数据在城市空间结构研究中的应用领域。

著录项

作者
赵亮;
展开▼
作者单位

辽宁工程技术大学;

展开▼
授予单位辽宁工程技术大学;
学科矿山计算机应用与空间信息工程
授予学位博士
导师姓名刘建辉;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类测绘数据库与信息系统;
关键词
地理信息系统; 空间数据; 分类变量; 相似度度量;

相似文献

中文文献
外文文献
专利

1. 多分类有序反应变量Logistic回归及其在国家医师资格考试研究中的应用 [J] . 高歌 ,张明芝 . 数理统计与管理 . 2003,第z1期
2. GIS探索性空间数据分析方法及其在地价分布信息提取中的应用研究 [J] . 刘志坚 ,陈思源 ,欧名豪 . 安徽农业大学学报 . 2007,第3期
3. 序次Logistic回归模型中因变量分类数的确定 [J] . 王全众 . 统计研究 . 2006,第011期
4. 多分类有序反应变量logistic逐步回归分析在上海市医疗保险调查中的应用 [J] . 高歌 ,王晓燕 ,艾自胜 . 中国卫生统计 . 2002,第006期
5. 基于GIS的决策树算法在空间数据分类中的分析与研究 [J] . 徐茜子 . 科技信息 . 2006,第11X期
6. 多分类有序反应变量Logistic回归及其在国家医师资格考试研究中的应用 [C] . 高歌 ,张明芝 . 中国现场统计研究会2003年学术年会 . 2003
7. 响应变量为连续型和多分类型的多元纵向数据分析 [A] . 路莉倦 . 2009

GIS空间数据分析中的分类变量相似度研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅