首页> 中国专利> 一种基于城市经济分类分析的城市权利透明度差异化评价体系匹配方法及系统

一种基于城市经济分类分析的城市权利透明度差异化评价体系匹配方法及系统

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种基于城市经济分类分析的城市权利透明度差异化评价体系匹配方法及系统，包括以下过程：建立基于城市经济的城市权利透明度差异化评价指标体系；收集城市权利透明度以及城市经济的原始数据，原始数据为连续数据；对该数据进行预处理，预处理后的数据为离散数据；使用关联学习算法构建一个关联模型，将预处理后的数据输入模型。挖掘数据之间的强关联规则，将存在关联的特征抽取出来建立数据基础形成标准数据集；使用分类算法构建一个分类模型，对标准数据集中的的特征数据进行分类；按Bi‑LSTM‑Attention网络输出的分类结果给城市定级，并匹配相应的指标体系进行后续城市权利透明度评估工作。根据上述工作构建系统，该系统包括数据收集模块、数据处理模块、关联规则学习模块、分类模块以及匹配模块。本发明对城市经济进行有效分类是后续匹配城市权利透明度差异化指标体系工作的基础，为保证城市权利透明度差异化评价系统的有效实施提供参考和指导，并解决了城市权利透明度领域现存的评价体系单一化、与经济背景不兼容的问题。

著录项

公开/公告号CN114912772A

专利类型发明专利
公开/公告日2022-08-16

原文格式PDF
申请/专利权人山东省计算中心（国家超级计算济南中心）;齐鲁工业大学;
展开▼

申请/专利号CN202210430077.7
发明设计人周鸣乐;王然;李刚;韩德隆;李敏;李旺;刘一鸣;
展开▼

申请日2022-04-22
分类号G06Q10/06(2012.01);G06Q50/26(2012.01);G06K9/62(2022.01);G06N3/04(2006.01);G06N3/08(2006.01);G06F16/215(2019.01);G06F16/2458(2019.01);
代理机构
代理人
地址 250014 山东省济南市经十路东首科学院路19号
入库时间 2023-06-19 16:23:50

法律信息

法律状态公告日

法律状态信息

法律状态
2022-09-02

实质审查的生效 IPC(主分类):G06Q10/06 专利申请号:2022104300777 申请日:20220422

实质审查的生效

说明书

技术领域

本发明涉及机器学习技术领域，具体涉及的是一种基于城市经济差异化分类分析的城市权利评价体系匹配系统。

背景技术

城市权利评标指标体系的建立必须考虑到政治、社会经济水平、文化、历史、基础设施因素的多样性，这些因素共同代表了城市权利的背景。

然而，事实上，城市权利举措是在许多不对称的政治、社会经济、基础设施环境中进行的，这意味着现有的评价体系不能满足兼容经济环境的需求。因此需要一种满足城市权利与既定目标经济之间兼容性的差异化指标体系，差异化的指标体系更能满足评价的合理性，完整性需求。

综上，本发明对城市经济进行有效分类是后续匹配城市权利差异化指标体系工作的基础，为保证城市权利差异化评价系统的有效实施提供参考和指导，并解决了城市权利领域现存的评价体系单一化、与经济背景不兼容的问题。该发明为优化营商环境，增强政府职能，充分发挥政府的示范和领导作用提供保障。

发明内容

本发明的目的是为了分析城市权利与社会经济发展之间的相关机制，克服现有技术缺乏基于差异化评价体系，难以实现与城市经济一体化的需求。本公开了一种基于城市经济分类分析的城市权利差异化评价体系匹配方法及系统。

为解决上述问题，本专利提供了一种基于城市经济分类分析的城市权利差异化评价体系匹配方法及系统，其特征在于，包括以下过程：

S1：建立基于城市经济的城市权利差异化评价指标体系。

S2：收集城市权利以及城市经济的原始数据，原始数据为连续数据；对该数据进行预处理，预处理后的数据为离散数据。

S3：使用关联学习算法构建一个关联模型，将步骤S2得到的数据输入模型。挖掘数据之间的强关联规则，将存在关联的特征抽取出来建立数据基础。

S4：使用分类算法构建一个分类模型，对步骤S3抽取的特征数据进行分类。

S5：按S4模型的分类结果给城市定级，并匹配相应的指标体系进行后续城市权利评估工作。

S6：根据上述关联分类方法构建系统，该系统包括数据收集模块、数据处理模块、关联规则学习模块、分类模块以及匹配模块。

1、根据权力要求1所述的城市经济差异化分类分析的城市权利评价体系匹配方法，其特征在于，所述步骤S1中的建立差异化指标体系包括：

S11：指标体系建立。评价指标的来源包括两个方面，一是通过文献分析，选择具有代表性的相关指标；二是参考国家已实施的关于城市权利的各项政策文件。

S12：差异化实现。所述对城市权利考核的差异性体现于不同的权重，采用AHP层次分析法对权重进行定性定量分析，分别适配经济发展水平不同的地区。每一类地区的城市权利评价体系包括一级指标、二级指标、三级指标。

所述的城市经济差异化分类分析的城市权利评价体系匹配方法，其特征在于，所述步骤S2中的收据收集和预处理包括：

S21：数据收集和清洗。对采集的城市权利和城市经济数据进行清洗，去除不需要字段填补缺失值。

S22：数据预处理。采用PCA进行降维减少输入特征的数量，只保留第一主成分，方差保留95％。

S23：采用分布分析进行区间化，满足后续模型对数据离散化的要求。根据直方图频数分布情况将城市权利水平按区间划分为高质量、中等质量和低质量；将经济发展水平指标离散化为多个区间包括：高发展、中发展和低发展。

所述的城市经济差异化分类分析的城市权利评价体系匹配方法，其特征在于，所述步骤S3中的构建关联学习模型包括：

S31：频繁项集挖掘。支持度即为几个项关联出现的概率，使用支持度来作为我们判断频繁项集的标准，依赖连接和剪枝步的互相融合，得到最大频繁项集。支持度计算公式及如下：

S32：强关联规则学习。从频繁项集中找出符合最小置信度的项集，强关联规则满足最小支持度和最小置信度。置信度计算公式如下：

S33：特征抽取。将存在强关联的项集所属的特征提取出来，对于每个特征时间Xt，Xt＝[x

所述的城市经济差异化分类分析的城市权利评价体系匹配方法，其特征在于，所述步骤S4中的构建分类模型采用LSTM-Attention方法，包括双向的LSTM网络和Attention机制，LSTM用于记忆和关注特征数据的时序信息，Attention机制用于捕捉特征数据的重要程度，具体步骤包括：

S41：使用Attention机制改进LSTM网络，构建Bi-LSTM-Attention网络模型。Bi-LSTM-Attention在双向LSTM的模型上加入Attention层，其实现是通过保留LSTM编码器对输入序列的中间输出结果，然后训练一个模型来对这些输入进行选择性的学习并且在模型输出时将输出序列与之进行关联。双向LSTM将从两个神经网络中提取的特征融合，然后进行softmax分类。在Attention层中，我们先对LSTM每个时间步的隐向量输出计算权重，然后将所有时序的向量进行加权和作为特征向量，然后拼接LSTM的最后提取的融合向量，从而可以保留经过权重分配的每个时间步的信息和整体时间段的信息，最后将数据输入到softmax进行分类。

S42：使用Sklearn中的随机分割工具将数据集被拆分为训练集、验证集和测试集，比例为6：2：2。对Bi-LSTM-Attention网络进行训练和测试，输出最终的分类结果：真假目标的概率。

所述的城市经济差异化分类分析的城市权利评价体系匹配方法，其特征在于，所述步骤S5中通过Bi-LSTM-Attention网络将城市按照经济质量和城市权利发展水平分成三类，按照分类给城市定级，并匹配相应的指标体系进行后续城市权利评估工作。

一种基于城市经济差异化分类分析的城市权利评价体系匹配系统，其特征在于，包括数据收集模块、数据处理模块、关联规则学习模块、分类模块以及匹配模块。数据处理模块包括数据清洗模块、数据降维模块以及数据离散化模块。关联规则学习模块包含频繁项集挖掘模块和强关联规则生成模块。分类模块包括输入层、LSTM层、Attention层和输出层。

A)数据收集模块：收集城市权利以及城市经济发展的历史数据，形成原始数据集。

B)数据处理模块：对原始数据集进行数据清理、降维和离散化。数据处理模块又可以分为以下三个模块。

清洗模块：对原始数据集进行清洗，去除不需要字段填补缺失值。

数据降维模块：将标准化后的相关指标数据采用主成分分析法进行降维处理，只保留第一主成分。

数据离散化模块：将连续的指标数据离散为三个区间数据。

C)关联规则学习模块：使用Apriori算法对城市权利特征数据以及城市经济数据进行关联分析，获得两组数据间的强关联结果。关联分析模块又可分为以下两个模块。

频繁项集生成模块：通过迭代，检索出关联规则模型中的所有频繁项集，完成连接步和剪枝步。

强关联规则挖掘模块：利用频繁项集模块生成的数据挖掘城市权利特征数据与城市经济质量之间的强关联规则。

D)分类模块：通过构建Bi-LSTM-Attention网络模型，以及对网络模型的训练得到良好的分类结果。

输入层：由关联规则构建数据集，对抽取的特征进行归一化处理。

Bi-LSTM层：双向LSTM层包含正反两个信道的LSTM网络，它们的单个功能与普通LSTM网络相同。根据选择记忆门、遗忘门以及输出门三个门对LSTM单元状态的控制，可以通过LSTM单元存储前后关联的信息输出每个时序对应的隐向量。

Attention层：第一步是构建query向量和key向量进行相似度计算，得到权重，此过程即为寻址过程，通过当前数据的query向量与其他数据的key向量进行相似度计算，可以得到与其他数据之间的权值；第二步为权值归一化，通过softmax等激活函数将权值归一化到指定范围；第三步为加权求和，将得到的各权重与该数据对应的value向量进行加权求和得到新向量，即为该数据Attention机制输出。

输出层:输出分类结果。

E)匹配模块：按分类结果给城市定级，并匹配相应的指标体系进行后续城市权利评估工作。

本发明的有益效果是：本发明综合考虑了城市间的经济差异背景，首次提出基于城市经济的城市权利差异化指标设计和兼容性匹配方法，该方法减少人为因素对分类结果的干扰和专家考察定级的工作量，解决了城市权利评价工作与实际背景不匹配的问题，极大地提高了城市权力透明度评价的效率和合理性。本发明选择关联算法进行特征的提取，避免无关特征对模型的影响；然后采用Bi-LSTM-Attention网络。本文提出的模型性能良好，与CNN、 LSTM、CNN-LSTM网络比较，精度最高达到0.93。本发明提出的算法可应用于所有需要关联分析的领域。

附图说明

图1是本发明提供的一种基于城市经济分类分析的城市权利差异化评价体系匹配方法及系统的方法步骤流程图。

图2是本发明提供的一种基于城市经济分类分析的城市权利差异化评价体系匹配方法及系统的系统结构示意图。

图3是本发明提供的BI-LSTM-Attention模型内部架构图。

图4是注意力机制结构示意图。

具体实施方法

为了使本发明的目的及技术方案更加清晰，以下结合附图对本发明进行进一步的说明。

本发明所涉及的方法步骤流程如图1所示，所述方法包括：

步骤一：建立基于城市经济的城市权利差异化评价指标体系。

在此步骤中，首先划分指标体系，城市权利一级指标包括“行政权力运行公开”“重点领域信息公开”“依申请公开”“政策解读与回应关切”和“城市权利保障机制”。二级三级指标由各区、县、政府部门的服务类别和经济差异所制订。另外采用专家打分法(Delphi)和地区经济实际考察把历史城市数据进行分类。最后采用AHP层次分析法对具体权重进行定性定量分析，按经济发展和城市权利设置三类城市权利指标A类、B类、C类分别适配经济发展水平不同的地区。

步骤二：收集城市权利以及城市经济的原始数据，原始数据为连续数据；对该数据进行预处理，预处理后的数据为离散数据。

在本步骤中，对历史指标评估得分数据进行定量数据的分布分析绘制频率分布直方图并修剪异常值，根据直方图频数分布情况将城市权利和经济发展水平按区间划分为高水平公开、中低水平公开和低水平公开区间；使用主成分分析法对相关指标进行预处理消除数据量纲，对地方人均GDP、地方标准化发展、依申请公开数量等数据进行标准化处理。计算所有标准化数据线性组合的方差构造m个主成分。确定各主成分Fi关于原标准化数据变量的表达式，即系数，其公式如下：

只保留第一主成分，方差保留95％，计算经济发展各项指标数据在m个主成分上的得分，其公式如下：

步骤三：使用关联学习算法构建一个关联模型，将步骤S2得到的数据输入模型。挖掘数据之间的强关联规则，将存在关联的特征抽取出来建立数据基础。

在本步骤中，关联规则挖掘分为两步:首先，找出所有频繁项集(支持度大于或等于最小支持度阈值)。在此过程中，将join和剪枝步骤融合在一起，得到最大频繁项集。此外，强关联规则是由频繁项集生成的。强关联规则满足最小支持度和最小置信度。

支持度是数项关联的概率。最小支持度是支持度阈值的度量，代表了项目集在统计学意义上的最小重要性。对于Apriori算法，我们以支持度作为判断频繁项集的标准。置信度是指项目集A出现时，项目集B出现的概率。A对B的支持度和置信度计算公式如下：

在本发明中最小支持度设置为50％、最小置信度设置为70％，若关联规则高水平发展区间＝>城市经济高发展水平区间，则认为该组规则可作为存在关联的特征抽取出来。

最后将抽取的特征，对于每个特征时间Xt，Xt＝[x

步骤四：使用分类算法构建一个分类模型，对步骤S3抽取的特征数据进行分类。

在本步骤中，使用Attention机制改进LSTM网络，Attention内部结构如图3所示。构建Bi-LSTM-Attention网络模型，Bi-LSTM-Attention模型架构如图4所示。首先建立双层LSTM网络，双层LSTM网络包含正向LSTM和反向LSTM分别计算得到对应的时序前向隐藏状态和时序后向隐藏状态，两个状态叠加成为LSTM编码器对输入序列的中间输出结果，然后训练一个模型来对这些输入进行选择性的学习并且在模型输出时将输出序列与之进行关联。双向LSTM将从两个神经网络中提取的特征融合，然后进行softmax分类。在 Attention层中，我们先对LSTM每个时间步的隐向量输出计算权重，然后将所有时序的向量进行加权和作为特征向量，然后拼接LSTM的最后提取的融合向量，从而可以保留经过权重分配的每个时间步的信息和整体时间段的信息，最后将数据输入到softmax进行分类。

最后使用Sklearn中的随机分割工具将数据集被拆分为训练集、验证集和测试集，比例为6：2：2。对Bi-LSTM-Attention网络进行训练和测试，通过调整参数输出最终的最优分类结果：真假目标的概率。各个算法模型的精度比较如下表所示：

本发明所涉及的系统结构如图2所示，所述系统包括：

包括数据收集模块、数据处理模块、关联规则学习模块、分类模块以及匹配模块。数据处理模块包括数据清洗模块、数据降维模块以及数据离散化模块。关联规则学习模块包含频繁项集挖掘模块和强关联规则生成模块。分类模块包括输入层、LSTM层、Attention层和输出层。