首页> 中国专利> 一种基于大数据的社区人口特征分析及供电分类服务体系

一种基于大数据的社区人口特征分析及供电分类服务体系

摘要

一种基于大数据的社区人口特征分析及供电分类服务体系,属供电管理领域。基于居民用户日用电量分平谷时段数据进行用电模式分析,针对各类重点用户类型进行分析和识别;采用有监督学习的支持向量机方法和无监督学习的k‑means聚类方法进行分析,得出各类重点用户类型的用户特征和用电模式;完成对各类重点用户类型的具体评价;将用电数据应用于人口特征的挖掘分析,通过提出社区人口特征评价方法,使电业更好地为社区服务。其将用电数据应用于人口特征的挖掘分析,通过构建针对人口特征的多元化供电服务体系,有助于供电公司扩大终端用能市场;发挥用电信息采集系统的应用价值,实现用电数据增值。可广泛用于供电管理领域。

著录项

  • 公开/公告号CN113128860A

    专利类型发明专利

  • 公开/公告日2021-07-16

    原文格式PDF

  • 申请/专利权人 国网上海市电力公司;

    申请/专利号CN202110411410.5

  • 申请日2021-04-16

  • 分类号G06Q10/06(20120101);G06Q30/02(20120101);G06Q50/06(20120101);G06K9/62(20060101);

  • 代理机构31230 上海三和万国知识产权代理事务所(普通合伙);

  • 代理人蔡海淳

  • 地址 200122 上海市浦东新区中国(上海)自由贸易试验区源深路1122号

  • 入库时间 2023-06-19 11:52:33

说明书

技术领域

本发明属于供电管理领域,尤其涉及一种针对不同性质社区人口的供电分类管理体系。

背景技术

近年,随着国际化的发展以及经济结构、人口结构的变化,上海这样的大都市 中的家庭(指对应一个用电地址的居民用户)类别呈现多样化趋势,并出现了不少 新的类型。

例如,随着房地产业的发展和人民生活水平的提高,拥有两套以上住房的家庭 越来越多,同时外来务工人员增加,由此出现了许多租客型家庭;又如,七八十年 代最早执行独生子女政策的一代人已进入老龄阶段,空巢问题加剧,老龄独居型家 庭已成为不容小觑的一类群体;此外,居民收入差距增大,教育背景参差不齐,这 些都使得用户在能源消费能力和综合素质上有所不同。不同类型家庭的用电模式呈 现不同的特征,掌握其用电特征是构建各类家庭辨识方法的基础。

随着用电信息采集技术的发展,近年用电大数据分析在电力营销领域的应用不断发展,如:智能家居管理,即实施非侵入式家庭用电负荷监测,掌握用户家电使 用情况,从而开展家电负荷控制,达到节能降耗的目的;反窃电管理,即通过用电 数据异常分析,实施窃电可疑用户搜索,从而缩小现场稽查的范围,提高反窃电工 作效率;信用评价,即对用户用电量和欠费情况实施综合评价,评估用户用电信用, 等等。

但是,上述研究中的数据分析都只局限于用户用电行为本身的特征分析,尚未 涉及人口特征的挖掘分析。

发明内容

本发明所要解决的技术问题是提供一种基于大数据的社区人口特征分析及供 电分类服务体系。其从社区人口流动型、老龄独居、消费能力、综合素质四类特征 出发,开展了家庭人口特征分类;在此基础上,提炼出不同人口特征家庭的用电特 征指标,提出基于用电大数据分析的社区人口流动型、老龄独居、消费能力、综合 素质特征的评价方法;进而针对不同人口特征的家庭,构建了分类供电服务体系。 具有可行性和较高的准确性;所提分类服务方案实施后可获得可观的技术经济效益。

本发明的技术方案是:提供一种基于大数据的社区人口特征分析方法,其特征是:

基于绝大多数小区都能够采集获得的居民用户日用电量分平谷时段数据,进行用电模式分析,针对各类重点用户类型进行分析和识别;

对各类重点用户类型,提取能够反映各自用电特征的指标,分别采用有监督学 习的支持向量机方法和无监督学习的k-means聚类方法进行分析,基于分析得出各 类重点用户类型的用户特征和用电模式;

采用与各类用户相对应的评价方法,完成对各类重点用户类型的具体评价。

具体的,将用电数据应用于人口特征的挖掘分析,通过提出社区人口特征评价 方法,使电业更好地为社区服务。

进一步的,不仅对传统采集系统提供的居民平谷电量进行分析,还对HPLC系 统采集的15分钟一点的居民用电数据进行分析,从日、周、季、多年多个角度提 取特征指标,构建相应的人口特征分析方法。

具体的,通过用电数据分析,评估对性台区所在区域的人口流动性,实施包括 社区人口年龄结构、就业方式、消费能力、综合素质的多方面特征的分析,进而使 得供电分类服务成为可能,也为社区分类服务提供信息参考。

进一步的,所述的各类重点用户类型至少包括流动型家庭、老龄独居家庭、低 消费能力家庭和高消费能力家庭。

更进一步的,采用数据挖掘中无监督型的分类方法——k-means聚类方法来识别流动型家庭;其具体分析的步骤如下:

步骤一:对所采集的社区用户日电量数据进行清洗,修补异常和缺失数据;

步骤二:对每个家庭用户,根据其至少两年的日电量数据,计算年用电量波动 率

步骤三:基于所有采集用户的特征数据,从选取聚类数k=2开始,使用k-means 方法进行聚类;

步骤四:选取不同的聚类数k=3,4…,重复步骤三的内容;

步骤五:根据轮廓系数等聚类评价指标确定最佳聚类数k

更进一步的,采用基于支持向量机SVM,构建非线性二分类的分类器来识别老 龄独居家庭,其具体分析的步骤如下:

步骤一:对所采集的社区用户日电量数据进行清洗,修补异常和缺失数据;

步骤二:对每个居民家庭用户,据其一年内的日电量数据,计算出白天用电比 重

步骤三:根据独居老人住户信息为每个样本用户添加是否为老龄独居家庭的标签,基于有标签的归一化样本特征数据,筛选出训练集来训练支持向量机,构建分 类器模型;

步骤四:根据训练出来的分类器模型,对未知是否老龄独居的家庭计算特征指 标

更进一度,采用无监督学习的k-means聚类方法来识别高消费能力家庭或低消 费能力家庭,其具体分析的步骤如下:

步骤一:对所采集的社区用户日电量数据进行清洗,修补异常和缺失数据;

步骤二:对每个家庭用户,根据其日电量数据,计算日均用电量相对水平

步骤三:基于所有采集用户的特征数据,第i个用户样本以特征向量的形式表示为

步骤四:选取不同的聚类数k=3,4…,重复步骤三的内容;

步骤五:根据包括轮廓系数的聚类评价指标,确定最佳聚类数k

同理,将聚类中心特征数据最符合低消费用户用电特征的类别作为低消费家庭类别,将属于该类的家庭判定为低消费家庭。

本发明的技术方案,还提供了一种按照上述基于大数据社区人口特征分类的供电分类服务体系,其特征是:将用电数据应用于人口特征的挖掘分析,基于社区用 户的日用电量数据,从多个角度提取特征指标,在确定社区人口特征后,通过构建 针对人口特征的多元化供电服务体系,提升供电公司在终端用能服务领域的服务质 量,进而帮助供电公司扩大终端用能市场;发挥用电信息采集系统的应用价值,实 现用电数据增值。

具体的,所述的不同类型居民,至少包括流动型家庭、老龄独居家庭、低消费 能力家庭和高消费能力家庭;

其中,针对流动型家庭的供电服务包括:预付费服务、流动型家庭账单服务以 及深夜谷电优惠政策;

针对老龄独居家庭的供电服务包括:电费托管业务、电器托管业务、安心用电 服务以及暖冬关怀计划;

针对低消费能力家庭的供电服务包括:预付费服务、均衡账单服务以及暖屋折 扣服务;

针对高消费能力家庭的供电服务包括:全电气化改造服务、递减式谷电阶梯电 价服务以及冬夜地暖用电折扣服务;

所述的供电分类服务体系,通过用电数据分析感知家庭人口特征,在确定社区 人口特征后,从不同类型居民的用电需求出发,在保证正常供电管理的技术上,针 对不同类型居民,构建不同种类的供电服务体系,有针对性的提供对应的供电服务; 通过构建针对人口特征的多元化供电服务体系,提升供电公司在终端用能服务领域 的服务质量,帮助供电公司扩大终端用能市场;发挥用电信息采集系统的应用价值, 实现用电数据的增值。

与现有技术比较,本发明的优点是:

1.本技术方案将用电数据应用于人口特征的挖掘分析,通过提出社区人口特征评价方法,使电业更好地为社区服务,促进社区的和谐和安全;

2.不仅对传统采集系统提供的居民平谷电量进行分析,还对目前正在推行的宽带高速电力线载波(high-speed power line carrier,HPLC)系统采集的15min一点的 居民用电数据进行分析,尽可能从日、周、季、多年多个角度提取特征指标,构建 相应的人口特征分析方法;

3.通过构建针对人口特征的多元化供电服务体系,提升供电公司在终端用能服务领域的服务质量,提升供电公司形象,进而有助于供电公司扩大终端用能市场; 发挥用电信息采集系统的应用价值,实现用电数据增值。

附图说明

图1是大都市家庭典型类别示意图;

图2是流动型(租客型)家庭夏季典型工作日负荷波形图;

图3是流动型(租客型)家庭近三年负荷波形对比图;

图4是老龄型家庭冬季典型日负荷波形图;

图5是老龄型家庭春秋季典型日负荷波形图;

图6是老龄型家庭老龄型家庭近三年负荷波形对比图;

图7是低消费能力和高消费能力型家庭夏季典型日负荷波形图;

图8是低消费能力型家庭近三年负荷波形对比图;

图9是高消费能力型家庭近三年负荷波形对比图;

图10是本发明针对流动型家庭的服务体系示意图;

图11是本发明针对老龄独居家庭的服务体系示意图;

图12是本发明针对低消费能力、高消费能力家庭的服务体系示意图;

图13是本发明均衡账单服务示意图。

具体实施方式

下面结合附图对本发明做进一步说明。

我国居民在家庭组成方式、生活方式、就业方式等方面日趋多样化,城镇化和 房地产发展又带来社区人口流动型问题,这些都为社区服务和供电服务提出了多样 化的需求。无论从社区层面还是供电企业层面,提供符合人口特征的专项服务,如 独居老人专项服务、低收入群体特别关怀服务、高人口流动型社区特别安全监管等 等,都是促进社会温暖与和谐的重要问题。

与其他行业的消费数据相比,用电数据更紧密地与用户的年龄、作息习惯、工 作性质、消费能力等人口特征有关。

因此,通过用电数据分析,不仅可评估人口流动性,还可实施社区人口年龄结 构、就业方式、消费能力、综合素质等多方面特征的分析,进而使得供电分类服务 成为可能,也为社区分类服务提供信息参考。

综合考虑近年上海出现的新型家庭,各类家庭在用电负荷特性上的差异,以及 可能推行的差别化用电服务,将大都市家庭典型类别划分为图1中的几种。其中:

(1)流动型分类中:流动型对应租客型家庭,其余为非流动型家庭。

(2)年龄特征分类中:年轻型家庭的家庭成员处于18~40岁之间,可能是单身青年独居,也可能是多个青年合住;老龄型家庭指完全由60岁以上老人组成的家庭, 即老龄独居型家庭;其余归入多代际家庭,以两代和三代合住为主。

(3)消费能力分类中:低消费能力家庭指可支配收入较少,从而用电量较少的住户;高消费能力家庭则可支配收入较多而有能力多消费电能;其余归为中等消费能 力家庭。一个地区低、中、高消费能力家庭的具体判定标准,需通过该地区居民用 户年用电量的聚类分析获得。

(4)综合素质分类中:LVIP代表综合素质较低的家庭,此类家庭有较多违约用 电记录或拖欠电费记录;SVIP代表综合素质较高的家庭,此类家庭没有违约用电记 录且缴费及时;其余归为N型用户。

不同年龄、工作性质、消费水平、人员素质的家庭在电能消费和缴费行为上表 现出不同的特征。基于这点,通过开展基于用电大数据的家庭人口特征分析研究, 提出了根据人口特征提供的分类供电服务体系,可用于丰富社区服务和推行分类供 电服务。

通过收集2019年11月以来的HPLC数据(high-speed power line carrier,高速电力线载波,也称为宽带电力线载波,是在低压电力线上进行数据传输的宽带电力 线载波技术。宽带电力线载波通信网络则是以电力线作为通信媒介,实现低压电力 用户用电信息汇聚、传输、交互的通信网络),同时采用网络调查的方式,对不同 类型家庭的典型用电模式开展了调研,根据调研结果所表明的各类家庭的用电特点, 从采集数据中找出各类家庭典型的日、周、季节、多年用电负荷曲线,基于这些负 荷数据开展各类家庭的用电模式特征分析。

一、各类家庭的典型用电模式:

1、流动型家庭用电模式分析:

(1)日用电模式分析:

据调研结果,流动型(即租客型)家庭(简称流动型家庭或流动家庭)以单代 际家庭为主,且绝大多数住户的年龄在19~30岁之间,少数在30~40岁之间。

另一方面,对采集到平谷电量和HPLC数据的居民用户,评估其相邻年同期的 负荷特性相似性指标,具体包括春节后(3月)周负荷特性(周一至周日用电占一 周用电比重)相似性、秋季开学后(9月)周负荷特性相似性、1至12月用电量的 相似性、月用电量占年用电量比重的相似性等;随后,基于这些指标对用户实施聚 类分析,将相似性低的一类中的用户标签为流动型家庭;将标签为流动型且收集到 HPLC数据的家庭的典型日负荷标幺值曲线取平均,作为流动型家庭的典型日负荷 标幺值曲线,图2中给出了夏季日典型日负荷标幺值曲线。

(2)多年用电模式分析:

据调研,物业租赁多为1~3年的租期,其次为超过3年的长租,1年内短租的 情况很少。为考察租赁型家庭不同年间负荷特性的差异,以及负荷特性差异主要出 现的月份,挑出一户标签为流动型的用户,整理其近三年的日用电波形,如图3所 示(其中2020年数据截至7月底)。可见,此类家庭的多年用电模式具有如下特点:

相邻年间同期用电量差异较大。以图中户号为例,该户号2018年和2019年的 3月中旬(第66天)~5月中旬(第144天)期间用电量都较高,而2020年同期用 电量几乎为零,很可能为相应物业停租期。即便是2018和2019年有用电量的时期, 同期用电水平也有显著差异。

无论哪一年,2月(第32~60天)的日用电量都极低。这与租赁型用户春节回 乡过年有关。

可能出现若干月用电量持续低值的情况。以图中户号为例,2020年第40天~ 第209天的日用电量持续低值,几乎为零。该持续低值阶段对应租赁中断、物业空 置的时期。

每年的2月末、3月初(对应第66天左右)和7月(对应第182~209天)都有 一个低值用电期,随后日用电量突然增高。这与转租多发生在春节后和夏季7月后 有关。

综合调研结果和聚类分析结果,可以发现流动型家庭的日用电模式具有如下特点:

从家电配置来看:以小型家电为主,通常不配置地暖、中央空调等家电,娱乐 性家电(如音响)配置不普遍,但多数配置办公家电(电脑、路由器等)。

从家电使用时间来看:家电使用概率最高的时段集中在夜间20:00~23:00;办公型家电使用概率超过了传统娱乐型家电(电视机、音响等);此外,此类家庭在夏 季较高概率使用制冷设备,且多表现为持续使用。

从负荷波动情况来看:一日内有早、晚两个用电高峰,白天出门上班后用电水 平较低;夜晚负荷下降时间(对应休息时间)很晚,且由于空调设备的持续使用, 夏季谷电比重达到44.5%,这与此类用户多为青年的特征相符。

值得说明的是,虽然只对流动型家庭个别季节的日负荷特点做了分析,但所获 知的主要用电特征(如家电配置特点、用电主要集中于夜间、谷电比较较大等)同 样符合流动型家庭在其他季节的情况;此类家庭在不同季节的日负荷特性的差异, 可能主要在夜间负荷下降时间(休息时间各季节略有差异)和高峰期的负荷水平上 (与是否使用电制冷/采暖设备有关)。

2、老龄家庭用电模式分析:

由于年轻型家庭的日、周、季用电特征与租赁型家庭高度相似(租赁型家庭本 身就以年轻型家庭为主),而年轻型家庭中分为租赁型、非租赁型两类,前者的多 年用电模式即流动型家庭多年用电模式,后者的多年用电模式同所有非租赁型家庭 的多年用电模式,因此不对年轻型家庭用电模式做专门分析,仅对老龄型家庭(老 龄独居情况,简称老年家庭)的用电模式做分析。

(1)日用电模式分析:

图4和图5分别是老龄独居家庭冬季、春秋季节的典型日负荷波动情况。从中 可见,此类家庭的日用电模式具有如下特点:

日用电波动与租赁型家庭差异显著,用电高峰主要在白天,尖峰负荷出现在上 午10:00左右和傍晚18:00左右,夜间谷电比重平均只为18.8%;

夜间用电负荷速降时间(对应睡觉时间)很早,为20:00左右。

(2)多年用电模式分析:

挑出老龄型家庭典型用户,整理其近三年的日用电波形,如图6所示(其中2020 年数据采集到7月底为止)。可见此类家庭不同年间的用电模式相比,具有如下特 点:

常年有人居住,基本不存在用电量持续多日低值的情况;

夏季日(第200~250天左右)的日用电量最高,其他季节略低;

不同年份间的日用电量波动情况非常相似。

3、不同消费能力家庭用电模式分析:

(1)日用电模式分析

在实施的网络调研中询问了家庭月开支范围,包括3000元以下、3000~6000元、6000~10000元、10000~20000元、20000元以上几档。从调研反馈表中选取月开支 3000元以下的用户作为低消费能力型家庭,月开支在20000元以上的家庭作为高消 费能力家庭。

此外,以居民阶梯电价第一阶梯年用电量上限(3120kWh/年)和第三阶梯年用 电量下限(4800kWh/年)作为低、高消费能力家庭的判定条件,标签出低、高消费 能力家庭(其中低消费能力家庭中剔除具有20:00以前用电水平速降的老龄特征的 家庭);对标签为低/高消费能力的每一个家庭,在每一季节,对其日负荷曲线取标 幺值,通过聚类找出成员数最多的类,进而将该类聚类中心对应的日负荷标幺值曲 线作为低/高消费能力家庭在相应季节的典型日负荷标幺值曲线。图7中给出了这两 类家庭夏季日典型负荷标幺值曲线。

综合调研结果和聚类分析结果,可以发现低、高消费能力家庭的日用电模式具 有如下特点:

从家电配置来看:低消费能力家庭基本不使用地暖、衣服烘干机、中央空调、 音响等高功耗非基础性家电,不使用电热水器、空调柜机、打印机、微波炉、电取 暖器、饮水机等常见家电的家庭也较多;高消费能力家庭中,不少家庭拥有多台洗 衣机、电视机、空调挂机、电脑。

从家电使用时间来看:低消费能力家庭电器开启最为密集的时段为夜间18~23时,夏季、冬季高耗能的制冷/取暖设备虽在20~22时期间也有较高概率,但持续时 间较短,几乎不在深夜使用;其他用电设备中,娱乐型家电(主要是电视机)使用 概率最高,其次为烹饪家电和电脑,但都具有短时使用的特点。与此相比,高消费 能力家庭家电使用密集程度的昼夜差别不如低消费能力家庭明显,夏季制冷、冬季 电采暖设备的昼夜使用概率都很高,且具有较高开启概率的持续时间较长。

从负荷波动情况来看:低消费能力家庭用电主要在7:00~22:00,并且白天和晚间用电负荷比较平稳。这一方面可能由于低消费能力家庭以无职业、低收入家庭为 主,另一方面由于本身用电量不多,此类用户对分时电价不敏感,谷时用电比重仅 为10.2%;但与老龄独居家庭相比,此类用户20:00~22:00的用电量较多。找到的那 一户高消费能力家庭与低消费能力家庭的典型日负荷特性有很大差别,其用电主要 集中于深夜,谷电比重高达49.6%。对曹杨地区其他年用电量超4200kWh的用户(含 未安装HPLC的)统计谷电比重均值,发现达到32.23%,也非常高。这说明高消费 能力家庭夏季晚间普遍有持续性使用空调的习惯,此外还可能具有生活作息时间较 晚的普遍现象。

(2)多年用电模式分析:

从标签为低消费能力、高消费能力的家庭中挑出典型用户,进一步分析其近三 年的日用电量波形,如图8所示。可见,这两类家庭多年用电模式有如下特点:

低消费能力家庭不同年份同期的日用电量水平非常相近,夏季日及1月末至2 月间个别日的用电水平较高,其余日子日用电水平基本一致。

高消费能力家庭不同年份同期的日用电量水平可能有显著差异,且一年内日用电量水平波动也很显著,这与娱乐性大功率家电使用的随机性有关。此外,图中用 户2018年6月18日(第170天)至9月17日(第261天)的用电量水平都比较 高,而2019年仅7月14日(第196天)至8月9日(第222天)的用电量与2018 年同期相当,其余日子用电量很小,这可能与高消费能力家庭有暑期旅游或到其他 物业度假的习惯有关。高消费能力家庭的另一个特征是,全年存在夏季、冬季两个 用电高峰,且夏季高峰起始时间早、持续时间长(大约在5月初至9月初一直处于 日用电量高峰期),反映了这些家庭在大功率制冷/采暖设备的使用中不怎么考虑经 济条件的制约。

上述分析表明,人口特征与用电特征有较强的关联性,不同的用电模式可表征 不同的人口特征。这为下一步研究社区人口特征辨识提供了基础。

二、社区人口特征综合评价方法:

1、流动型(租客型)家庭评价方法:

1.1、特征指标:

根据前述分析,流动型(租客型)家庭用电的基本特征是:

①由于租客的流动,全年日用电量波动较非流动型家庭频繁且幅度更大;

②由于租客的变化,不同年份间同期用电模式差异较大;

③租客的变化主要发生在春节后和暑期,故而常在这两个时期出现持续较长时间的日用电量连续低值;

④1~2月由于租客回乡过年,月均用电量较低。鉴于此,提出如下特征指标作 为流动型家庭评价指标:

(1)年用电量波动率

以月用电量标准差的形式定义年用电量波动率,公式为

上式中:E

(2)年间用电相似性

年用电相似系数反映家庭月用电量波动情况在不同年份间的相似度,通过计算相邻两年12个月用电量的皮尔逊相关系数来评定。具体计算步骤为:

■计算最近的相邻两年(第y年、第y-1年)逐月的用电量标幺值,即当月用 电量占当年用电总量的比重。第y年、第y-1年第m月的用电量标幺值分别 记为

■计算相邻两年(第y年、第y-1年)用电量标幺值的均值,记为

■按下式计算相邻两年月用电量标幺值的皮尔逊相关系数,作为年用电相似系数:

显然,

(1)冬季用电率

冬季用电率定义为用户冬季月(仅关注涉及春节的1、2月)用电量占全年用电 量的比例。若所考虑的时间跨度为n

流动型家庭由于租客在春节期间返乡过年,

(2)夏季用电率

夏季用电率定义为用户夏季月(7~8月)用电量占全年用电量的比例。类似的, 若所考虑的时间跨度为n

出租房中不少在7~8月间发生转租,故而这两个月的用电量较小,

(1)相邻年春节后日用电比重相似系数

春节后三月(即月份m=2,3,4)是租赁合同更新的高峰期,为此特别考察相邻年该时期日用电比重的相似性。“日用电比重”指某一类型日(星期几)占一周用电 量的比重,它反映家庭的周用电模式。

具体而言,本指标按下述方法定义:

■对社区内每一家庭,计算春节后三月中星期一至星期日的用电量比重。第y 年春节后的星期i(i=1,…,7)的日用电量比重计算为

上式中:W

■对第y-1年按同样方法计算

■采用皮尔逊相关系数来考察相邻两年春节后三月日电量比重的相似程度,即周用电模式的相似性,计算公式为

其中,

(2)相邻年夏季后日用电比重相似系数

夏季同样是租赁合同更新的高峰期,为此特别考察相邻年该时期日用电比重的相似性。该指标记为

值得指出的是,在考察年用电相似系数x

1.2、评价方法:

流动型家庭由于租赁用户的多变性,其住户信息往往难以有准确及时的登记。 这意味着获取确定为租赁、非租赁状态的家庭样本十分困难。因此,采用数据挖掘 中无监督型的分类方法——k-means聚类方法来识别流动型家庭。其具体算法的步 骤如下:

步骤一:对所采集的社区用户日电量数据进行清洗,修补异常和缺失数据。由 于日电量数据是表计的日冻结数据,需要通过相邻日冻结值的累减得到当日的实际 用电量。

E

式中,E

此外,存在由于电表更换或数据采集传输过程中失真导致实际日电量存在负值的情况,使用相邻日的正常日电量数据修补异常值,如式(9)。

步骤二:对每个家庭用户,根据其日电量数据(至少两年),计算年用电量波动 率

步骤三:基于所有采集用户的特征数据,从选取聚类数k=2开始,使用k-means 方法进行聚类。k-means聚类实质是求解一个最优化问题,优化目标是使样本与其 所属类别中心之间的距离总和最小,通常以欧氏距离为度量,即

式中:C为一种划分;

步骤四:选取不同的聚类数k=3,4…,重复步骤三的内容。

步骤五:根据轮廓系数等聚类评价指标确定最佳聚类数k

2、老龄独居家庭评价方法:

2.1、特征指标:

老龄独居家庭用电的基本特征是:

①日用电集中于白天,8:00~18:00用电比重明显高于非老龄化家庭;

②夜间早睡,故而通常在20:00左右出现用电负荷显著的向下水平迁移;

③一周内用电平稳,工作日和周末的日用电量水平差别不大;

④年间相似度高且各季节日均用电量差异小;

⑤日均用电量明显比非老龄化家庭小。

根据上述特征,定义如下特征指标用于后续老龄独居家庭的判定:

(1)白天用电比重

取家庭8:00~18:00用电量作为白天用电量,计算白天用电站占日用电量的比重,再对所考察时间范围内(如一年)的白天用电比重取均值,作为白天用电比重指标 取值。若所考察的时间范围为近一年,则

(2)戌时用电量下降速率

针对老龄独居家庭通常在20:00左右入睡,此期间用电量下降明显的特征,定义本指标。具体计算方法是:分别对19:00~20:00和20:00~21:00两个时段,计算用电 负荷下降速率,再取均值,即

(3)周用电量稳定性指标

本指标考察一周内日用电量的稳定性。具体计算步骤为:

■从一年内第一周开始,计算目标家庭每天用电量占当周总用电量的比重。记 目标家庭在第w周第i天的用电量占其所属周总用电量的比重为r

■对一年中每周计算日用电量稳定性系数,公式为

上式中,n

■计算一年内所有周的日用电量稳定性系数的均值,作为日间用电比重稳定性指标,即

老龄独居家庭一周内工作日和非工作日的用电量相近,故而日间用电比重稳定性指标

(4)夏-春秋日用电量增长率

鉴于老龄独居家庭夏季制冷空调使用少,夏季和春秋季日均用电量水平差别不大的特征,设置本指标。若以近一年为考察期,则

(5)冬-春秋日用电量增长率

类似的,鉴于老龄独居家庭冬季采暖空调使用少,冬季和春秋季日均用电量水 平差别不大的特征,设置本指标。若以近一年为考察期,则

(6)日均用电量相对水平

老龄独居家庭日均用电量相较于非老龄化家庭明显偏低,故而定义归一化的日均用电量相对水平指标

上式中:E

值得留意的是,上述指标体系中,白天用电比重

2.2、评价方法:

独居老人的住户信息社区通常有登记,但上门走访属于侵入式调研;而借助用 电特征分析实现老龄独居家庭的辨识,一方面属于非侵入式分析,可减少对居民生 活的干扰,另一方面也可作为信息准确性的检验手段。

由于可掌握一些验证为老龄独居、非老龄独居的家庭信息,因此老龄独居家庭 的辨识可以采用数据挖掘技术中有监督的学习算法。本技术方案提出基于支持向量 机(support vector machine,SVM),构建非线性二分类的分类器用来识别老龄独居 家庭的方法。其具体算法步骤如下:

步骤一:对所采集的社区用户日电量数据进行清洗,修补异常和缺失数据。清 洗过程同式(7)至式(9)所述。

步骤二:对每个居民家庭用户,据其一年内的日电量数据,计算出白天用电比 重

步骤三:根据独居老人住户信息为每个样本用户添加是否为老龄独居家庭的标签,基于有标签的归一化样本特征数据,筛选出训练集来训练支持向量机,构建的 分类器模型。支持向量机分类的基本思想是通过非线性变换将较低维的输入空间原 始数据映射到近似线性可分的高维特征空间中,然后在特征空间中基于最大间隔原 则学习最优线性分类面。其中通过核函数来定义输入空间映射到特征空间后的内积 计算。分类的决策函数式为:

上式中:N为样本数,b

步骤四:根据训练出来的分类器,对未知是否老龄独居的家庭计算特征指标

3、低、高消费能力家庭评价方法:

3.1、特征指标:

如果单按年用电量大小属于阶梯电价第几档来做辨识,无法从低/高用电量用户中排除流动型、老龄独居家庭。为与其他几种人口特征的家庭相区别,需要综合日、 周、季、多年用电特性构建特征指标。

低消费能力型家庭的用电特征是:

①日均用电量非常低;

②一周内日用电量波动不明显,不存在周末用电量增大的现象;

③年间同期用电量近似;

④冬-春秋季用电比重相近,但夏-春秋季用电比重可能略高;

⑤谷电比重很小。值得留意的是,老龄独居家庭中不少也属于低消费能力家庭,但老年人普遍主观上不喜欢使用电制冷、电采暖设备,故而第④点是低消费能力家 庭相对于与老龄独居家庭的主要区别。

此外,老年人夜间休息时间较早,若能采集HPLC数据,则可对20:00~22:00时 段的用电量加以分析,以进一步区分老龄独居和非老龄的低消费能力家庭。

高消费能力型家庭,具有的用电特点是:

①日均用电量非常高;

②由于高耗能娱乐性用电设备使用时间的随机性,此类用户一年内的用电量波动率高;

③同样娱乐性用电设备使用时间的随机性,此类用户年间同期用电量的相似性较低;

④不存在较长的低电量期;

⑤夏-春秋用电比大,且冬-春秋用电比也大;

⑥谷电比重较高。

根据上述用电特征,设计如下指标体系,用于后续对低、高消费能力家庭的辨 识:

(1)日均用电量相对水平

该指标是家庭近一年内日均用电量的标幺值,归一化的基准为全网年用电量最大的用户在近一年内的总用电量。指标的计算公式同式(17)。

(2)年用电量波动率

该指标考察一年内月用电量的波动率,计算公式同式(1)。

(3)周用电量稳定性

该指标考察一周内不同类型日(星期几)之间用电比重的稳定性,计算公式同 式(13)、式(14)。

(4)年间用电相似性

该指标考察不同年间同期用电量占年总用电量比重的相似性,计算公式同(2)。

(5)低电量月占比

本指标主要用于将同样为年间用电相似性较低的高消费能力型家庭与流动型家庭区分开来。据调研和统计,冰箱的待机损耗通常为15kWh/月,每日为0.5kWh左 右,再加上其他电器可能的待机损耗,以月用电量≤15kWh/月作为低电量月的判定 条件。则,低电量月占比定义为

上式中,N

(6)夏-春秋日用电量增长率

本指标的定义同式(15)。低消费能力型家庭的

(7)冬-春秋日用电量增长率

本指标的定义同式(16)。同样,低消费能力型家庭的

(8)谷电占比

谷电占比是判定低消费能力型家庭的重要指标。上海市居民销售电价中目前对平谷电价的时段划分为22:00~次日6:00为谷时段,此处即以该时段为谷时段,计算 家庭全年谷电比重的均值。计算公式为

3.1、评价方法:

用户家庭的消费能力往往难以通过社区登记的用户信息直接反映。因此,采用 无监督学习的k-means聚类方法来识别高低消费能力家庭。其具体算法的步骤如下:

步骤一:对所采集的社区用户日电量数据进行清洗,修补异常和缺失数据。修 补方法如式(3-7)至(3-9)所述。

步骤二:对每个家庭用户,根据其日电量数据,计算日均用电量相对水平

步骤三:基于所有采集用户的特征数据,第i个用户样本以特征向量的形式表示为

步骤四:选取不同的聚类数k=3,4…,重复步骤三的内容。

步骤五:根据轮廓系数等聚类评价指标确定最佳聚类数k

三、社区分类供电服务体系

在确定社区人口特征后,可从不同类型居民的用电需求出发,借鉴国内外经验,提供不同种类的供电服务。

A、针对流动型家庭的供电服务:

流动型家庭所需要的服务主要是电费的可控性和账单的便捷管理;而针对流动型家庭中绝大多数是年轻人,作息时间较晚的特点,还可推行特殊的谷电激励措施。 基于上述原则,提出针对流动型家庭的供电服务,具体如图10所示。

各项服务的具体操作方法是:

(1)预付费服务:由出租房业主向电力公司提出预付费申请,在提供身份证明、 物业产权证明并购买了具备预付费供能的智能电表之后,可为指定的租赁性 物业开通预付费供能。此后,使用出租房的居民需要购买预付费充值卡,充 值后方能使用电能。该项服务便于业主防范租客未付清电费而逃逸。

(2)流动型家庭账单服务:租赁房业主可在以下账单类型中自主选择。

a)账单备份服务:出租房业主向电力公司提供身份证明和物业产权证明, 并对相应出租房提出此项服务申请之后,电力公司在业主申请的期限内, 每月同时向出租的物业地址和业主登记的长住地址寄送账单,以便业主 掌握出租房的电费缴纳情况。

b)账单自动转移服务:出租房业主向电力公司提供身份证明和物业产权证 明后即可申请开通此项服务。此后,由该物业租客在提供租赁合同的情 况下,提出临时用户申请,账单即以租客的名字寄往出租房地址;而当 租客致电电力公司告知租赁期满后,下月账单则以原业主名字寄往业主 登记的常住地址。

c)多物业同步计费服务:同时拥有多套物业的用户,可选择此项服务。申 请成功后,电力公司将一张合并多物业电费信息的账单寄到用户登记的 常住地址。此项服务可方便用户对多物业的管理。

(3)深夜谷电优惠政策:目前上海对居民用户只有22:00~次日6:00电价折半这一种谷电优惠政策。随着新能源消纳比重的增长,深夜负荷低、谷电难以平 衡矛盾较为突出。如何进一步促进深夜谷电的提升成为亟待解决的问题。为 此,可借鉴东京电力,推出“夜间8型”(23:00~7:00)和“夜间10型”(22:00~8:00) 两种谷电优惠制度,对夜间8型给予更优惠的谷电价格,激励习惯夜生活的 年轻人增加谷时用电。

B、针对老龄独居家庭的供电服务:

老龄独居家庭需要在缴费和电器使用、更换、维修方面更为便捷的服务,此外 从关怀独居老人和促进深夜谷电消费的角度出发,还可考虑为独居老人提供冬天夜 间使用电采暖的特殊补贴。为此,设计针对老龄独居家庭的供电服务如图11中所示。

各项服务的具体操作方法是:

(1)电费托管业务:老年人多数不熟悉电子支付,甚至对银行卡的使用也不大熟悉,同时又腿脚不便,每月去邮局或供电服务部门营业大厅付费很不方便。为此可 推出本项服务——电力部门可派业务员上门办理电费托管业务,在独居老人签署电 费托管协议并登记银行卡后,电力公司每月按老人实际用电情况,从银行卡中扣除 电费;也可采用年度充值方式,由业务员在年初上门一笔预付电费,逐月按实际使 用情况扣除,次年年初结清并再上门充值。

(2)电器托管业务:独居老人在有电器更换或维修需求时,打电话给电力部门, 由电力部门派人上门办理。

(3)安心用电服务:电力部门定期派检修人员上门检查独居老人用电安全性,并对独居老人提供电路维修业务(独居老人可选择由所在物业或电力公司提供此项服 务)。

(4)暖冬关怀计划:为老人提供冬日采暖专项用电补贴,补贴可按冬日谷电电费的一定比例设置,从而鼓励老人多用冬日谷电采暖。

C、针对不同消费能力家庭的供电服务:

低消费能力家庭主要关注节费和延期付款服务;高消费能力家庭则是电业开拓电力市场的主要对象,应积极鼓励这些用户多用电,尤其为增加谷电、缓解系统谷 电平衡压力多做贡献。

基于上述考虑,针对低消费、高消费能力家庭提出供电服务方案,如图12中 所示。其中:

(1)对低消费能力家庭:

a)预付费服务:向低消费能力家庭建议采用预付款业务,并可考虑给与预付费 电表减免费用的优惠。

b)均衡账单服务:对低消费能力家庭,电费可能是一笔不小的开支。夏季和冬 季月用电量较多,可能给家庭带来较大的经济负担。为此,可以考虑为此类家庭提 供均衡账单服务。本项服务仅适用于过往一年中没有拖欠电费或违约用电记录的高 信用度家庭。在用户提出申请后,每月按上年平均月电费收取本年度每月电费,7 月初按上半年实际月均电费与上一年月均电费的差值调整下半年月均电费,从7月 起按调整后的月均电费收费,次年1月再滚动更新月均电费(其具体实施过程如图 13中所示)。这项服务有助于使得家庭月用电开支均衡化,减少冬季、夏季用电高 峰的电费压力。

c)暖屋折扣服务:对此类用户冬季谷电给予一定的折扣。

(2)对高消费能力家庭:

a)全电气化改造服务:提供全电气化改造的一揽子服务,包括改造设计、预算 和节费分析、电器购置、电器安装、电器维修等服务。通过全电气化改造,一方面 使得此类用户获得更安全、更清洁的用能环境,另一方面也有助于电力公司扩大终 端用能市场份额。

b)递减式谷电阶梯电价服务:目前对所有居民采用的是递增式阶梯电价,这种 电价有促进节能节电的作用。为缓和谷时负荷平衡的矛盾,可对具备多用电能力的 高消费能力家庭,试行递减式谷价,即该时段电价随着谷电的增加而递减,促进谷 电使用。

c)冬夜地暖用电折扣服务:地暖耗电量极大,有些家庭随配置了地暖却很少使用。可向安装了地暖的高消费能力家庭推行冬季谷电折扣业务,鼓励这些家庭在冬 季谷时使用地暖。

采用本技术方案按人口特征对各类家庭实施对应的供电服务,可产生以下直接效益:

对流动型家庭:因实施预付费可规避电费拖欠46.3元/户·年,对应案例台区 为4861.5元/年;同时,因促进移峰填谷可使供电公司增加收益54.75元/年·户, 对应案例台区为574.9元/年。

对低消费能力家庭:通过预付费或均衡账单,每年减少电费拖欠6kWh/天·户*90天*0.515元/度=278.1元/户·年,对应案例台区可规避电费拖欠6674.4元/年。

对高消费能力家庭:若全接受电气化改造,则可增加售电量1935kWh/年·户, 相应可增加售电收入将近1160元/年·户;通过递减式谷电阶梯电价促进移峰填谷, 增加收益91元/年·户;还可通过冬夜地暖用电折扣,增加冬夜地暖用电量1120kWh/ 年·户,相应增加电费收入336元/年·户(仅考虑高消费能力家庭中20%采用地暖)。

若将本项目成果推广到某区所有居民台区,按60万户,各类家庭占比同试点台 区计,则可获得总收益11222万元/年。

若进一步考虑将本项目成果推广到全市,按总户数560万户,各类家庭占比同 试点台区计,则可获得总收益104735万元/年。

此外,按人口特征对各类家庭实施分类供电服务,还可获得间接效益,主要包 括:

对流动型家庭提供账单备份、账单自动转移、多物业同步计费等服务,方便了 群众,有助于提升客户满意度;

对老龄独居家庭提供电费托管、电器托管、用电检查和电路维修、暖冬关怀等 服务,可提升老龄人用电的便捷性和舒适性感受,促进社会温暖和和谐,同时也有 助于提升公司社会形象;

对低消费能力家庭提供均衡账单、暖屋折扣服务,对高消费能力家庭提供全电 气化改造的一条龙服务,不仅有助于提高售电量,也为这些家庭带去了便捷和温暖, 同样有助于提升公司形象,提升客户粘度。

本技术方案中所涉及到的k-means聚类是一种基于划分的聚类算法。由于其具 有简单易实现且效果好的优点而得到广泛应用。

k-means聚类实质是求解最优化问题,优化目标是使样本与其所属类别的中心之间的距离总和最小,通常以欧氏距离为度量。

式中C为一种划分,x

k-means聚类算法是一个迭代的过程,每次包含两个步骤。第一步在给定聚类中心的情况下,根据每个样本到类中心的距离将其划分到对应类中,使得每个样本至 所属类中心距离最近;第二步根据划分的结果,计算当前各类中样本均值作为新的 聚类中心。重复以上两步直到迭代收敛或达到停止条件,最后得到聚类的结果。

支持向量机(support vector machine,SVM)是机器学习领域最重要的方法之一。可以用于解决回归问题(support vector regression,SVR),也可以用于线性或非线性 二分类与多分类问题(support vector classification,SVC)。

支持向量机分类的基本思想是通过非线性变换将较低维的输入空间原始数据映射到近似线性可分的高维特征空间中,然后在特征空间中基于最大间隔原则学习最 优线性分类面。其中通过核函数来定义输入空间映射到特征空间后的内积计算。分 类的决策函数式为:

式中,N为样本数,b

本发明的技术方案,基于绝大多数小区都能够采集获得的居民用户日用电量分平谷时段数据,针对各类社区服务关注的重点用户类型进行分析和识别;对各种用 户类型提取能够反映各自用电特征的指标,分别采用有监督学习的支持向量机方法 和无监督学习的k-means聚类方法进行分析,基于分析得出各类用户的用户特征, 能够有效地利用用电数据帮助社区提升管理水平和服务质量。

通过实施本发明的技术方案后,能够得到如下主要结论:

(1)流动型家庭具有全年日用电量波动大、不同年份间同期用电模式差异大、春节后和暑期后常有较长时间的日用电量连续低值、1~2月日均用电量低的特点;老 龄独居家庭具有用电集中于白天、夜间用电负荷下滑时间早、日间和季间用电量平 稳、日均用电量较小等特点;低消费能力家庭具有日均用电量非常低、工作日和假 期日用电量波动不明显、冬-春秋季用电比重相近但夏-春秋季用电比重略高、谷电 比重小等特点;高消费能力家庭具有日均用电量高、一年内日用电量波动率高、不 同年间同期用电量的相似性较低、夏-春秋和冬-春秋用电比均较大的特点;而家庭 人员素质与拖欠电费的次数、金额大小、违约用电次数等因素有明显关联性。基于 上述特征,可从日内负荷分布、周内用电量波动、季节间用电量差异、不同年间同 期用电模式相似性、电费缴纳及时性、拖欠和违约电费次数等多个角度设置特征指 标,实现基于大数据分析的家庭人口特征判定。

(2)对于掌握可靠样本的家庭人口特征,如前面提到的老龄独居特征,可采用分类器作为辨识工具,通过基于样本的有监督学习训练分类器;而对于未能掌握可靠 样本的人口特征,采用聚类这种无监督的学习方法更为有效。对于小样本人口特征 辨识问题,如老龄独居家庭辨识,支持向量机是一种有效的选择,可获得较高的辨 识准确度。

(3)在人口特征分类基础上,对不同特征家庭推行不同的供电服务,可产生可观的直接经济收益,还可更好地服务于社区、服务于居民,提升公司形象,获得重要 的间接效益。

电力系统中居民用户的用电数据包含着用户的用电特征和用电习惯等信息,通过对用电数据的挖掘能够有效地分析社区人口的特征。

传统的社区人口特征往往是基于已登记的户籍信息或逐户的访察所得。逐户访察耗费的人力和时间都较多,且访察的周期间隔较长。通过户籍信息来了解用户特 征存在户籍信息可能不全,居住人员发生变动或家庭结构发生变化难以及时更新等 问题。例如,对于租客型家庭,很可能已经发生了租客的更换而社区尚未统计。对 于和子女合居的老人,如果子女之后与老人分开居住,或家庭发生变故,则变成了 老龄独居的家庭。此外,独局老人往往能够享有一些特殊的社区服务与补贴,如上 海市就有为独居老人免费安装智能门磁、管道燃气自闭阀等设备,此外还有居家养 老服务由专门的人员提供免费配送饭菜和上门理发等服务。可能存在一部分用户为 享有独居老人的特有服务而存在申报作假现象。

基于用电数据挖掘进行社区人口特征分析,能够更真实地反映居民用户的实际情况。因为用电数据是难以作假且实时采集的,当用户发生变动时用电数据也会相 应变化。

本发明的技术方案,将用电数据应用于人口特征的挖掘分析,基于社区用户的 日用电量数据,尽可能从多个角度提取特征指标,构建相应的人口特征分析方法; 采用数据挖掘中的支持向量机分类和k-means聚类算法进行各类用户的辨识。通过 构建针对人口特征的多元化供电服务体系,提升供电公司在终端用能服务领域的服 务质量,进而有助于供电公司扩大终端用能市场;发挥用电信息采集系统的应用价 值,实现用电数据增值。分析得到的社区人口特征,还可以帮助社区为住户提供更 加多样化和针对性的服务,提升社区的服务管理水平。

本发明可广泛用于供电管理领域。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号