首页> 中国专利> 一种史前聚落遗址分布特征的挖掘方法

一种史前聚落遗址分布特征的挖掘方法

摘要

本发明公开的史前聚落遗址分布特征的挖掘方法,包括如下步骤:a、空间数据与属性数据的获取;b、利用空间分析及统计方法,获取史前聚落遗址的环境倾向性、集聚性特征、遗址中心点、热点,初步获取史前聚落遗址的空间分布特征;c、运用逻辑回归法和证据权重法,定量分析史前聚落遗址与地理环境的关系,建立史前聚落遗址预测模型,并对模型进行评价与解释。从而提供了一种科学、合理地利用已发掘的大量考古资料,并为未来提高考古发掘决策水平和服务效率提供帮助。

著录项

  • 公开/公告号CN103150616A

    专利类型发明专利

  • 公开/公告日2013-06-12

    原文格式PDF

  • 申请/专利权人 南京信息工程大学;

    申请/专利号CN201310107312.8

  • 申请日2013-03-29

  • 分类号G06Q10/04(20120101);G06Q50/00(20120101);

  • 代理机构32206 南京众联专利代理有限公司;

  • 代理人顾进

  • 地址 210044 江苏省南京市宁六路219号

  • 入库时间 2024-02-19 19:15:47

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-03-10

    未缴年费专利权终止 IPC(主分类):G06Q10/04 专利号:ZL2013101073128 申请日:20130329 授权公告日:20170728

    专利权的终止

  • 2017-07-28

    授权

    授权

  • 2013-07-17

    实质审查的生效 IPC(主分类):G06Q10/04 申请日:20130329

    实质审查的生效

  • 2013-06-12

    公开

    公开

说明书

 

技术领域

    本发明涉及一种基于数据库、GIS等数字技术的考古方法,特别是一种史前聚落遗址分布特征的挖掘方法。

背景技术

考古学(Archaeology)属于人文科学的领域,在中国是历史科学的重要组成部分,世界其他国家 多从属于人类学,也有划归艺术史的。其任务在于根据古代人类通过各种活动遗留下来的物质资料,以研究人类古代社会的历史。实物资料包括各种遗迹和遗物,它们多埋没在地下,必须经过科学的调查发掘,才能被系统地、完整地揭示和收集。因此,考古学研究的基础在于田野调查发掘工作。

考古学的产生有长远的渊源,但到近代才发展成为一门科学。近代考古学发祥于欧洲,以后普及到世界各国。北宋以来的金石学是中国考古学的前身,但直到20世纪20年代,以田野调查发掘工作为基础的近代考古学才在中国出现。作为一门近代的科学,考古学有一套完整、严密的方法论。它包含史前考古学、历史考古学和田野考古学等分支,并与自然科学、技术科学领域内的许多学科以及人文、社会科学领域内的其他学科有着密切的关系。

考古学是通过发掘和调查古代人类的遗迹遗物和文献来研究古代社会的一门人文科学。传统上,考古学是文化人类学的一门分支学科,但是现在它越来越独立,成为了一门独立的学科。

考古学家与只研究历史记载的历史学家不同,他们通过研究远古人类的遗留物,对没有历史记载的史前文化也进行研究。考古学家致力于探索人类文化的起源。

其中,聚落考古,就是以聚落为对象,研究其具体形态及其所反映的社会形态,进而研究聚落形态的演变所反映的社会形态的发展轨迹。了解各功能区乃至单体建筑之间的联系,借以复原当时的社会。

聚落考古的研究开始于20世纪50年代,随着计算机技术的发展,GIS在80年代初开始应用到聚落考古研究中,主要集中在欧洲和北美。 GIS应用到考古学的基础就是考古数据的空间特征,GIS技术能为解决考古学的空间性和多变量问题提供了一种有效的方法手段。中国作为一个考古资源大国,如何科学、合理地利用已发掘的大量考古资料是一个亟待解决的问题。因此以GIS技术为基础的聚落考古研究具有十分广阔的发展前景。

 

发明内容

为解决上述问题,本发明公开了一种史前聚落遗址分布特征的挖掘方法,对现有的已发掘聚落遗址信息进行科学、合理的统计分析并加以应用,从而实现对聚落遗址的分布空间特征进行分析并建立模型,从而提高田野考古中史前聚落遗址发掘工作的决策水平和服务效率,并为制定和实施相关遗址的保护措施提供便利。

本发明公开的史前聚落遗址分布特征的挖掘方法,包括如下步骤:a、空间数据与属性数据的获取:从考古资料中获取史前聚落遗址相关的栅格数据及属性信息,结合研究区域的地形数据,利用GIS技术和数据库技术,根据已筛选、统计处理后的聚落遗址相关空间数据与属性数据,建立相应的空间数据库和属性数据库;b、利用空间分析及统计方法,获取史前聚落遗址的环境倾向性、集聚性特征、遗址中心点、热点,初步获取史前聚落遗址的空间分布特征;c、运用逻辑回归法和证据权重法,定量分析史前聚落遗址与地理环境的关系,建立史前聚落遗址预测模型,并对模型进行评价与解释。

本发明公开的史前聚落遗址分布特征的挖掘方法的一种改进,所述步骤a中空间数据库和属性数据库的构建步骤如下:a。空间数据的获取:利用相应的GIS软件对已有的聚落遗址相关栅格数据以及研究区域的地形数据进行数字化处理及地理配准,制成数字化地图;b、属性数据的获取:属性数据包括聚落遗址的名称或时期或位置或面积或文化层厚度或资料出处中的至少一种;c、基于GIS技术和数据库技术,根据已筛选、统计处理后的史前聚落遗址空间数据、属性数据及研究区域的地形数据,建立相应的空间数据库和属性数据库,空间数据库和属性数据库通过聚落遗址的编号进行关联。

本发明公开的史前聚落遗址分布特征的挖掘方法的又一种改进,所述步骤b利用空间分析及统计方法初步获取史前聚落遗址的空间分布特征包括如下步骤:a、提取史前聚落遗址的环境变量并进行统计,获取史前聚落遗址对于环境的倾向性,其中所述环境变量包括高程或坡度或坡向或距河流距离;b、根据史前聚落遗址的位置坐标的X值和Y值,计算出史前聚落遗址的质心作为该史前聚落遗址的平均中心,从而通过对比多个时期的平均中心的迁移得出史前聚落遗址的迁移规律;c、利用空间自相关局部指标G系数获取史前聚落遗址的聚集区域,即史前聚落遗址热点;d、根据史前聚落遗址间的平均距离与研究区域内相同数目的随机点的平均距离的比率,确定史前聚落遗址的分布类型为呈聚集分布或者随机分布。

本发明公开的史前聚落遗址分布特征的挖掘方法的又一种改进,所述步骤c中运用逻辑回归法构建史前聚落遗址预测模型,包括如下步骤:a、变量的选择及提取 选择史前聚落遗址以及随机点作为训练样本,其中随机点看作非遗址点,模型因变量只有两个值,遗址点为1,非遗址点机即随机点为0,自变量的选择包括高程或地形起伏度或坡度或坡向或表面曲率或视域或距离五级河流水平距离及垂直距离或距离小河水平距离及垂直距离或土壤类型或土壤质地,利用地形数据库生成相应环境变量的栅格表面,然后提取遗址点和非遗址点的自变量值,形成建立逻辑回归模型的数据集;b、检验变量显著性,优化构建的逻辑回归模型,并通过显著性检验拟合逻辑回归模型,所述逻辑回归模型为:                                               ,式中,因变量P为聚落遗址存在的概率;自变量xn为影响遗址存在的环境变量;n为选取环境变量的数目;参数βn为待求的回归系数;c、根据建立起来的逻辑回归模型计算整个研究区域的史前聚落遗址存在概率,然后将概率值重分类为低、中、高三个等级,等级越高,遗址存在的概率越大,并在GIS中生成遗址分布概率图;d、对逻辑回归遗址预测模型进行评价,并对该遗址预测模型及遗址分布概率图进行聚落考古解释,从而获取史前聚落遗址分布特征。

本发明公开的史前聚落遗址分布特征的挖掘方法的又一种改进,所述步骤c中运用逻辑回归法构建史前聚落遗址预测模型,包括如下步骤:a、对研究区域进行单元格划分,确保每个单元格内只存在一个或者不存在聚落遗址点,并计算先验概率,其中,先验概率的计算表达式为:,式中,P先验为先验概率,O先验为几率,D为聚落遗址数目,T为研究区域内单元网格数;b、权重值定义如下:,式中,W+、W-分别表示证据因子对应的遗址存在区和不存在区的权重值,证据图层中存在遗址的单元格数为B,而不存在区的单元数为;c、通过对证据图层进行基于卡方检验(chis-quare test)的条件独立性检验,在显著性水平为0.05的条件下,选择满足条件独立性要求的证据图层,计算后验概率,并生成遗址后验概率图,然后将概率值重分类成具有低、中、高三个等级的遗址分布概率图,等级越高,遗址存在的概率越大,后验概率对数公式为:,其中,k表示+或者-;m表示证据因子总数,j=(1,2,3…,m),Wj表示第j个证据因子;后验几率表示为:,则后验概率表示为:;d、对证据权重法史前聚落遗址预测模型进行评估,并对证据权重法史前聚落遗址预测模型分布概率图进行解释,进而获得史前聚落遗址分布特征。

本发明公开的史前聚落遗址分布特征的挖掘方法的又一种改进,通过Kvamme增益统计法对史前聚落遗址预测模型进行评价,评价公式如下:,式中,Pa表示概率区占研究区面积的比例,Ps表示概率区内史前聚落遗址点数目占研究区总遗址点数目的比例,Gain为增益值,如果概率区面积越小,而在此区域内发现的遗址点越多,则增益值越大,模型精度越高,增益值接近1时,表示模型具有很强的预测能力;当增益值接近0时,模型几乎没有预测能力;当增益值小于0时,模型则具有反向的预测能力,应预测遗址不存在的概率。

本发明公开的史前聚落遗址分布特征的挖掘方法的又一种改进,利用随机点法对史前聚落遗址预测模型进行评价,方法如下:在研究区域随机产生与史前聚落遗址相同数目的随机点作为非遗址点,利用史前聚落遗址预测模型统计遗址点与非遗址点的概率值,阈值选取0.5,即当样本点的概率值大于0.5时,判定该样本点为遗址点,否则为非遗址点。

本发明公开的史前聚落遗址分布特征的挖掘方法,通过对现有的已发掘聚落遗址信息进行科学、合理的统计分析并加以整合应用,并对聚落遗址的分布空间特征进行分析并建立模型,方便在考古资料查验、聚落遗址分布规律预测等考古相关工作的开展,从而提高田野考古中史前聚落遗址发掘工作的决策水平和服务效率,并为制定和实施相关遗址的保护措施提供便利,降低作业难度,提高工作的效率。

 

附图说明

图1、本发明公开的史前聚落遗址分布特征挖掘方法的流程图;

图2、本发明公开的利用逻辑回归法建立史前聚落遗址预测模型的流程图;

图3、本发明公开的利用证据权重法建立史前聚落遗址预测模型的流程图。

 

具体实施方式

下面结合附图和具体实施方式,进一步阐明本发明,应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。需要说明的是,下面描述中使用的词语“前”、“后”、“左”、“右”、“上”和“下”指的是附图中的方向,词语“内”和“外”分别指的是朝向或远离特定部件几何中心的方向。

如图1至图3所示,本发明公开的史前聚落遗址分布特征的挖掘方法,包括如下步骤:a、空间数据与属性数据的获取:从考古资料中获取史前聚落遗址相关的栅格数据及属性信息,结合研究区域的地形数据,利用GIS技术和数据库技术,根据已筛选、统计处理后的聚落遗址相关空间数据与属性数据,建立相应的空间数据库和属性数据库;b、利用空间分析及统计方法,获取史前聚落遗址的环境倾向性、集聚性特征、遗址中心点、热点,初步获取史前聚落遗址的空间分布特征;c、运用逻辑回归法和证据权重法,定量分析史前聚落遗址与地理环境的关系,建立史前聚落遗址预测模型,并对模型进行评价与解释。

本发明公开的史前聚落遗址分布特征的挖掘方法的一种改进,所述步骤a中空间数据库和属性数据库的构建步骤如下:a。空间数据的获取:利用相应的GIS软件对已有的聚落遗址相关栅格数据以及研究区域的地形数据进行数字化处理及地理配准,制成数字化地图;b、属性数据的获取:属性数据包括聚落遗址的名称或时期或位置或面积或文化层厚度或资料出处中的至少一种;c、基于GIS技术和数据库技术,根据已筛选、统计处理后的史前聚落遗址空间数据、属性数据及研究区域的地形数据,建立相应的空间数据库和属性数据库,空间数据库和属性数据库通过聚落遗址的编号进行关联。

本发明公开的史前聚落遗址分布特征的挖掘方法的又一种改进,所述步骤b利用空间分析及统计方法初步获取史前聚落遗址的空间分布特征包括如下步骤:a、提取史前聚落遗址的环境变量并进行统计,获取史前聚落遗址对于环境的倾向性,其中所述环境变量包括高程或坡度或坡向或距河流距离;b、根据史前聚落遗址的位置坐标的X值和Y值,计算出史前聚落遗址的质心作为该史前聚落遗址的平均中心,从而通过对比多个时期的平均中心的迁移得出史前聚落遗址的迁移规律;c、利用空间自相关局部指标G系数获取史前聚落遗址的聚集区域,即史前聚落遗址热点;d、根据史前聚落遗址间的平均距离与研究区域内相同数目的随机点的平均距离的比率,确定史前聚落遗址的分布类型为呈聚集分布或者随机分布。

本发明公开的史前聚落遗址分布特征的挖掘方法的又一种改进,所述步骤c中运用逻辑回归法构建史前聚落遗址预测模型,包括如下步骤:a、变量的选择及提取 选择史前聚落遗址以及随机点作为训练样本,其中随机点看作非遗址点,模型因变量只有两个值,遗址点为1,非遗址点机即随机点为0,自变量的选择包括高程或地形起伏度或坡度或坡向或表面曲率或视域或距离五级河流水平距离及垂直距离或距离小河水平距离及垂直距离或土壤类型或土壤质地,利用地形数据库生成相应环境变量的栅格表面,然后提取遗址点和非遗址点的自变量值,形成建立逻辑回归模型的数据集;b、检验变量显著性,优化构建的逻辑回归模型,并通过显著性检验拟合逻辑回归模型,所述逻辑回归模型为:,式中,因变量P为聚落遗址存在的概率;自变量xn为影响遗址存在的环境变量;n为选取环境变量的数目;参数βn为待求的回归系数;c、根据建立起来的逻辑回归模型计算整个研究区域的史前聚落遗址存在概率,然后将概率值重分类为低、中、高三个等级,等级越高,遗址存在的概率越大,并在GIS中生成遗址分布概率图;d、对逻辑回归遗址预测模型进行评价,并对该遗址预测模型及遗址分布概率图进行聚落考古解释,从而获取史前聚落遗址分布特征。

本发明公开的史前聚落遗址分布特征的挖掘方法的又一种改进,所述步骤c中运用逻辑回归法构建史前聚落遗址预测模型,包括如下步骤:a、对研究区域进行单元格划分,确保每个单元格内只存在一个或者不存在聚落遗址点,并计算先验概率,其中,先验概率的计算表达式为:,式中,P先验为先验概率,O先验为几率,D为聚落遗址数目,T为研究区域内单元网格数;b、权重值定义如下:,式中,W+、W-分别表示证据因子对应的遗址存在区和不存在区的权重值,证据图层中存在遗址的单元格数为B,而不存在区的单元数为;c、通过对证据图层进行基于卡方检验(chis-quare test)的条件独立性检验,在显著性水平为0.05的条件下,选择满足条件独立性要求的证据图层,计算后验概率,并生成遗址后验概率图,然后将概率值重分类成具有低、中、高三个等级的遗址分布概率图,等级越高,遗址存在的概率越大,后验概率对数公式为:,其中,k表示+或者-;m表示证据因子总数,j=(1,2,3…,m),Wj表示第j个证据因子;后验几率表示为:,则后验概率表示为:;d、对证据权重法史前聚落遗址预测模型进行评估,并对证据权重法史前聚落遗址预测模型分布概率图进行解释,进而获得史前聚落遗址分布特征。

本发明公开的史前聚落遗址分布特征的挖掘方法的又一种改进,通过Kvamme增益统计法对史前聚落遗址预测模型进行评价,评价公式如下:,式中,Pa表示概率区占研究区面积的比例,Ps表示概率区内史前聚落遗址点数目占研究区总遗址点数目的比例,Gain为增益值,如果概率区面积越小,而在此区域内发现的遗址点越多,则增益值越大,模型精度越高,增益值接近1时,表示模型具有很强的预测能力;当增益值接近0时,模型几乎没有预测能力;当增益值小于0时,模型则具有反向的预测能力,应预测遗址不存在的概率。

本发明公开的史前聚落遗址分布特征的挖掘方法的又一种改进,利用随机点法对史前聚落遗址预测模型进行评价,方法如下:在研究区域随机产生与史前聚落遗址相同数目的随机点作为非遗址点,利用史前聚落遗址预测模型统计遗址点与非遗址点的概率值,阈值选取0.5,即当样本点的概率值大于0.5时,判定该样本点为遗址点,否则为非遗址点。

实施例

如图1所示,本发明包括如下步骤:

    步骤10 空间数据与属性数据的获取:从考古资料中获取史前聚落遗址相关的栅格数据及属性信息,结合研究区域的地形数据,利用地理信息技术和数据库技术,根据已筛选、统计处理后的聚落遗址空间数据与属性数据,建立相应的空间数据库和属性数据库;

步骤20 挖掘史前聚落遗址分布规律,包括空间分析与统计方法及利用一些数据挖掘算法构建聚落遗址预测模型。

步骤30利用空间分析及统计方法,获取史前聚落遗址的环境倾向性、集聚性特征、遗址中心点、热点,初步获取史前聚落遗址的空间分布特征;

步骤40运用逻辑回归、证据权重法,定量分析史前聚落遗址与地理环境的关系,建立史前聚落遗址预测模型;

步骤50 对史前聚落遗址预测模型进行评价,并进行聚落考古解释,从而获取史前聚落遗址的空间分布规律。

根据图1,构建空间数据库与属性数据库的步骤如下:

步骤101 空间数据的获取:利用相应的GIS软件对已有的聚落遗址相关栅格数据进行数字化处理及地理配准,制成数字化地图;

步骤102 属性数据的获取:包括聚落遗址的名称、时期、位置、面积、文化层厚度、资料出处等信息;

步骤103 利用GIS技术和数据库技术,根据已筛选、统计处理后的史前聚落遗址空间数据、属性数据及研究区域的地形数据,建立相应的空间数据库和属性数据库,空间数据库和属性数据库通过聚落遗址的编号进行关联。

根据图1,利用空间分析及统计方法初步获取聚落遗址的空间分布规律,包括:

步骤301 提取史前聚落遗址的高程、坡度、坡向、距河流距离等环境变量并进行统计,获取史前聚落遗址对于环境的倾向性;

步骤302 根据史前聚落遗址间的平均距离与研究区内相同数目的随机点的平均距离的比率,确定史前聚落遗址的分布呈聚集分布或者随机分布;

步骤303利用局部G指数获取史前聚落遗址的聚集区域,即史前聚落遗址热点;

步骤304 根据史前聚落遗址的位置的X值和Y值,计算出质心作为聚落遗址的平均中心,对比多个时期的平均中心的迁移可大致观察出聚落遗址的迁移规律;

根据图2,利用逻辑回归法构建遗址预测模型包括如下步骤:

步骤 4011变量的选择及提取。选择史前聚落遗址以及随机点作为训练样本,其中随机点看作非遗址点。模型因变量只有两个值,即遗址点为1,非遗址点(随机点)为0。自变量的选择需要综合考虑影响遗址存在和分布的关键性因素,选择了高程、地形起伏度、坡度、坡向、表面曲率、视域、距离五级河流水平距离及垂直距离、距离小河水平距离及垂直距离、土壤类型、土壤质地等变量。利用地形数据库,生成相应环境变量的栅格表面,然后提取遗址点和非遗址点的自变量值,形成建立逻辑回归模型的数据集。

步骤4012 为了使构建的逻辑回归模型最优化,对变量进行显著性检验,然后通过显著性检验拟合逻辑回归模型。

逻辑回归模型为:

          

    式中,因变量P为史前聚落遗址存在的概率;自变量xn为影响遗址存在的环境变量;参数βn为待求的回归系数;n是选取环境变量的数目。

步骤4013 根据建立起来的逻辑回归模型计算整个研究区域的史前聚落遗址存在概率,然后将概率值重分类为低、中、高三个等级,等级越高,遗址存在的概率越大,并在GIS系统中生成遗址分布概率图。

根据图3,利用证据权重法构建史前聚落遗址预测模型,包括如下步骤:

   步骤4021 对研究区进行单元格划分,确保每个单元格内只存在一个或者不存在聚落遗址点,并计算先验概率。 

先验概率的计算表达式为:

式中,P先验为先验概率,O先验为几率,D为聚落遗址数目,T为单元网格数。 

步骤4022 选择影响史前聚落遗址分布的环境变量作为证据因子,根据史前聚落遗址确定证据因子的权重值。

权重值定义如下:

        

式中,W+、W-分别表示证据因子对应的遗址存在区和不存在区的权重值,证据图层中存在遗址的的单元格数为B,而不存在区的单元数为。

步骤4023 通过对证据图层进行基于卡方检验(chis-quare test)的条件独立性检验,在显著性水平为0.05的条件下,选择满足条件独立性的要求的证据图层,计算后验概率,并生成遗址后验概率图,然后将概率值重分类为低、中、高三个等级,等级越高,遗址存在的概率越高。

后验几率对数公式为:

         

后验几率可以表示为:

        

根据上述公式,可以得出后验概率表示为:

        

其中,k表示+或者-,即证据因子存在或不存在的意思,与W+、W-中+、-含义相同。m表示证据因子总数,j=(1,2,3…,m),表示第j个证据因子(证据图层)的权重值。             

步骤50 对史前聚落遗址预测模型进行评价,并对史前聚落遗址预测模型及遗址分布概率图进行解释,从而获取遗址分布规律。评价方法包括Kvamme增益统计法和随机点法:

步骤501 Kvamme增益统计法,方法如下:

     

式中参数Pa表示概率区占研究区面积的比例,Ps表示史前聚落遗址概率区内遗址点数目占研究区总遗址点数目的比例,Gain为增益值。如果概率区面积越小,而在此区域内发现的遗址点越多,则增益值越大,模型精度越高。增益值接近1时,表示模型具有很强的预测能力;当增益值接近0时,模型几乎没有预测能力;当增益值小于0时,模型则具有反向的预测能力,应预测遗址不存在的概率。

步骤502 随机点法,方法如下:

在研究区域随机产生与史前聚落遗址相同数目的随机点作为非遗址点,利用史前聚落遗址预测模型统计遗址点与非遗址点的概率值,阈值选取0.5,即当样本点的概率值大于0.5时,判定该样本点为遗址点,否则为非遗址点。判定预测准确率,从而从整体上把握遗址预测模型的精度。

本发明方案所公开的技术手段不仅限于上述技术手段所公开的技术手段,还包括由以上技术特征任意组合所组成的技术方案。以上所述是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号