公开/公告号CN112711864A
专利类型发明专利
公开/公告日2021-04-27
原文格式PDF
申请/专利号CN202110060580.3
申请日2021-01-18
分类号G06F30/20(20200101);G06Q10/06(20120101);G06F113/04(20200101);G06F113/16(20200101);
代理机构33206 浙江翔隆专利事务所(普通合伙);
代理人张建青
地址 310014 浙江省杭州市下城区朝晖八区华电弄1号
入库时间 2023-06-19 10:46:31
技术领域
本发明涉及配网电缆质量指标评测技术领域,具体涉及一种配网电缆质量指标相关性模型构建及数据拓展方法。
背景技术
随着城市电网的快速发展,电气系统配网电缆线路长度年增长率以超过15%的速度快速增长,部分大中城市中心区电缆化率已超过80%,配网电缆线路运行可靠性要求不断提高。目前,配网电缆及其附件生产厂家数量庞大,制造工艺与产品质量参差不齐,部分厂家存在不按标准生产、产品不符合技术规范、存在家族性缺陷等突出问题,而配网电缆运行质量反馈机制尚未健全,设备质量检验、线路交接与运维等试验方法及评价指标之间不系统、不关联,导致无法对电缆及附件产品质量进行有效的评估。
另外,需要通过高压试验来获得试验数据才能进行有效的评估,但由于高压试验本身成本高昂,试验数据较少,难以通过挖掘这些测试指标彼此之间存在着更深层次的联系(即不同配网电缆质量指标之间的相依程度),对配网电缆运行性能评价指标进行更科学客观的调整。
发明内容
本发明所要解决的技术问题是克服上述现有技术存在的缺陷,提供一种配网电缆质量指标相关性模型构建及数据拓展方法,在降低试验成本的同时,获得更客观的配网电缆运行性能评价指标相依程度,有助于对配网电缆运行性能评价指标进行更科学客观的调整。
为实现上述目的,本发明通过以下技术方案得以实现:一种配网电缆质量指标相关性模型构建及数据拓展方法,包括,
S1:获取至少两种关于配网电缆质量指标的试验数据;
S2:任取其中两种配网电缆质量指标,并分别将对应的试验数据构造成向量x和向量y;
S3:对x和y的统计学特征进行总结,得到x和y统计学意义上的分布区间和百分比;
S4:根据x和y的统计学特征,使用累积分布函数的核估计器将数据转换为copula尺度,使x和y的散点图在copula尺度(单位平方)下更加均匀、平滑;
S5:对x和y进行Copula函数分布的参数估计,得到这组数据的Copula函数秩相关系数与Copula参数,并据此对这组数据进行Copula分布拓展,得到N个数据点的Copula分布函数统计图;
S6:将拓展后的copula尺度下向量x和y的数据重构于原始单位尺度,可得N个数据点的质量指标x和y的数据统计学特征。
本发明进一步优选方案为:在所述步骤S4中,所述累积分布函数的核估计器的函数分布为
其中,n表示样本数量,f
本发明进一步优选方案为:所述核密度函数的表达式为
所述G(x)的表达式为
其中K(x)表示核平滑函数,h表示其带宽。
本发明进一步优选方案为:所述核平滑函数采用均匀核函数,其表达式为
本发明进一步优选方案为:在所述步骤S5中,N大于向量x和y中数值的个数,且N个数据点中单个数据点的数值大小在向量x和y中数值的最小值与最大值之间。
本发明进一步优选方案为:所述步骤S5中,N≥500。
本发明进一步优选方案为:所述关于配网电缆质量指标至少包括对电缆的振荡波局放测试指标和绝缘电阻的测试指标。
综上所述,本发明具有以下有益效果:通过Copula函数,得到了更客观的配网电缆运行性能评价指标(质量指标)之间的相依程度,有助于对配网电缆运行性能评价指标进行更科学客观的调整;在服从Copula函数分布的前提下,有助于将试验数据进行拓展,从而降低试验成本。
附图说明
图1是质量指标D1和D8的数据统计学特征。
图2是copula尺度下指标D1和D8的数据统计学特征。
图3是数据拓展后的copula尺度下指标D1和D8的数据统计学特征。
图4是数据拓展后原始尺度下指标D1和D8的数据统计学特征。
具体实施方式
以下结合附图对本发明作进一步详细说明。
本实施例仅仅是对本发明的解释,其并不是对本发明的限制,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本发明的权利要求范围内都受到专利法的保护。
本发明提供了一种配网电缆质量指标相关性模型构建及数据拓展方法,主要包括以下步骤:
S1:获取至少两种关于配网电缆质量指标的试验数据;关于配网电缆质量指标至少包括对电缆的振荡波局放测试指标和绝缘电阻的测试指标。
S2:任取其中两种配网电缆质量指标,并分别将对应的试验数据构造成向量x和向量y;
S3:对x和y的统计学特征进行总结,得到x和y统计学意义上的分布区间和百分比;
S4:根据x和y的统计学特征,使用累积分布函数的核估计器将数据转换为copula尺度,使x和y的散点图在copula尺度(单位平方)下更加均匀、平滑。所述累积分布函数的核估计器的函数分布为
其中,n表示样本数量,f
核密度函数的表达式为
而G(x)的表达式为
其中K(x)表示核平滑函数,h表示其带宽;核平滑函数采用均匀核函数,其表达式为
S5:对x和y进行Copula函数分布的参数估计,得到这组数据的Copula函数秩相关系数与Copula参数,并据此对这组数据进行Copula分布拓展,得到N(N≥500)个数据点的Copula分布函数统计图。N大于向量x和y中数值的个数,且N个数据点中单个数据点的数值大小在向量x和y中数值的最小值与最大值之间。
这里,Copula函数描述的是变量间的相关性,实际上是一类将联合分布函数与它们各自的边缘分布函数连接在一起的函数,因此也有人将它称为连接函数。
n维函数C:I
(1)对任意的u∈I
(2)对所有i∈{1,2,…,n},u
(3)对每一个u
(4)对于任意的0≤a
其中,
则称函数C为一个Copula函数。
虽然定义中阐述了Copula函数的一些基本统计性质,但Copula函数在构造随机变量联合分布时的特殊地位,源于著名的sklar定理。sklar定理是Copula函数理论及其应用的基础,阐述了copula函数构造多元函数联合分布的方法。
Sklar定理:设F(x
F(x
其中Copula函数描述了变量间的相关结构。
如果F
Sklar定理不仅是Copula函数的存在性定理,其重要意义还在于提供了分析联合分布与其边际分布的关系方法。将一个联合分布函数拆成其边际分布和相依结构两部分,也可以由边际分布函数和Copula函数来确定联合分布函数。
因此,Copula函数包含了所有随机变量间的相依关系,Sklar定理为我们提供了一个在不研究边际分布的情况下分析多元分布的相依结构的方法。将Copula函数看作一个多元分布函数,且其具有显式表达时,对应的Copula密度函数c存在(Copula为绝对连续情形),c可由式(6)得到。
根据Sklar定理,联合分布F(x
其中,f
S6:将拓展后的copula尺度下向量x和y的数据重构于原始单位尺度,可得N个数据点的质量指标x和y的数据统计学特征。
以下利用电缆振荡波局放测试的结果和绝缘电阻的测试结果按照上述的方法进行处理,其结果分析表明,D1和D8的二元联合分布指标已经足够对X1~X13进行区分和界定,可以认为在上述试验数据中,振荡波局放测试结果和绝缘电阻的测试具备典型特征。
本发明将利用Copula函数进一步对上述指标进行联合分析。
首先,对指标D1和D8的数据统计学特征进行总结,如图1所示。
可以看出,虽然D1和D8的分布域较广,但主要集中于图中左下角数值范围较小的区域。接着,使用累积分布函数的核估计器将数据转换为copula尺度(单位平方),结果如图2所示。
显然,copula尺度(单位平方)下的分布特征明显更加均匀、平滑。接着,对这组数据进行t分布拓展(根据向量x和y的最大值和最小值,可以均分出1000个点),得到1000个点的t-Copula分布函数统计图,如图3所示。
最后,将拓展后的copula尺度下指标D1和D8的数据重构于原始单位尺度,可得1000个点的运行模拟考核指标D1和D8的数据统计学特征,如图4所示。
换言之,图4展示了上述相似的试验重复1000次可能得到的统计学结果。可见,其整体符合原数据的统计学特征,在原量化模型分析中将得到相同或相似的结果。
机译: 癫痫发作预测装置,分析心电图索引数据的方法,癫痫发作预测计算机程序,模型构建设备,模型构建方法和模型构建计算机程序
机译: 三维数据评估模型的构建与评估方法,三维数据评估模型的构建装置,三维数据评估装置和计算机程序
机译: 对象语义数据建模系统;一种用于创建相对于数据库存储数据的数据库模式的方法,一种在D中解释公式的方法,以及一种对象语义类型的数据模型的有效期的数据模型,该对象语义类型的数据模型包括多个对象语义。和系统来创建数据库架构