
工商业用户典型负荷曲线模式分析.pdf
8页- 1 -工商业用户典型负荷曲线模式分析工商业用户典型负荷曲线模式分析1 王志勇,曹一家 浙江大学电气工程学院(310027) email: ncepuwzy@ 摘摘 要:要:工商业用电在总负荷中占有很大的比重,所以研究工商业用电特性,对电力系统的 安全经济运行和电力市场的发展有着重要的作用 在电力市场环境下, 了解客户特别是以工 商业为代表的大客户的用电模式特性可以帮助电力部门对客户类别进行划分并对不同的客 户群制订相应的市场策略, 使双方都受益 本文中使用多种聚类分析方法对已获取的工商客 户用电数据进行分析,通过选取最合适的聚类方法得到工作日及周末的典型负荷代表曲线 最后利用聚类所得到的知识, 选择合适的推理方法获取分类规则, 从而为将未知类型单位划 分给某特征曲线类提供了有效的工具 经实例验证, 本文方法所获取的负荷曲线能有效的代 表各种经济类型的负荷,分类规则也有较高的正确率,表明了本文方法是有效可行的 关键词:关键词:电力市场 负荷曲线特性 聚类分析 分类规则 数据挖掘 1.引言 1.引言 随着我国电力市场的发展和电力技术水平的不断提高, 负荷曲线特性分析作为电力市场分析的一项基础工作,对于电力企业的经营和规划发展越来越重要[1, 2]。
大体上可以将电力用户分成 3 类,第一类为农用电;第二类为居民用电;第三类为工商业及其他城市配电网中农电、居民用电比例较小,而且对居民用电的负荷特性分析也已有了一些有益的尝试[3],但是对于工商业用户的负荷特性分析目前仍然处于刚刚起步的阶段 随着电力市场的逐步发展,工商业用户越来越多地要求高质量和高可靠性地电力服务[4-6],对于电力供应部门来说,了解客户的用电模式特性、 根据各用户的用电特性对客户类别进行定义, 然后制订相应的购电合同,对于增强客户满意度、提高客户数量、增加经济效益有着重要的作用[7-10] 本文以杭州市为例, 针对从市电力局获取的工商业用电数据, 首先进行单位的分类随机抽取,在经过数据预处理后,采用多种聚类方法进行分析、然后使用多个指标来衡量各方法的优劣以及确定合理的聚类数目, 得到了工作日和周末情况下的典型负荷模式 最后通过使用合适的规则推理方法, 得到了有效的规则可以将某单位归类于某典型负荷模式, 经实例验证本文方法是有效可行的 2.负荷数据预处理 2.负荷数据预处理 2.1 数据获取数据获取 杭州市电力局已对市内所有100kVA及以上用电容量的工商业电力客户进行负荷管理终端的安装,按照经济活动类别将其分类,在每类中进行随机抽取,最终得到 750 单位 20051本课题得到高等学校博士学科点专项科研基金(项目编号:20030335003)资助 - 2 -年 6~8 月份负荷数据。
将数据分为工作日和周末(周六、周日)两类,本文中对两种情况分别进行分析 2.2 数据预处理数据预处理 各单位数据都是由智能表计设备进行就地采集、并以公共的 GSM 移动通信网络为载体发送到电力公司的,由于受网络情况等问题的影响,获取的数据中含有遗失值和异常点本文中对其处理如下: 某时刻的遗失数据用其他相似日的同时段负荷的平均值代替, 异常值的检测和修正采用线性回归方法[11]处理 2.3 单位日负荷曲线单位日负荷曲线 本文中各单位日负荷曲线(P)是采用 3 个月中同时刻负荷的平均值来确定的 , , , ()objobjPPMean•=, 其中ob代表单位编号;• 表示所有工作日范围内;[0 ~ 23]j∈,表示小时;Mean表示取平均值 2.4 数据归一化数据归一化 由于不同类型的单位有不同的最大负荷, 为了便于分析, 本文中采用如下的方法进行数据的归一化:, , , ob j obj obMaxPPPT=,其中ob代表单位编号;[0 ~ 23]j∈,表示小时;, obMaxP表示该单位每工作日平均负荷的最大值 3 聚类分析聚类分析 3.1 常用的聚类方法介绍常用的聚类方法介绍[ 11 ] 3.1.1 K-means K-means 是一种常用的传统聚类方法。
它的处理过程如下:首先从所有的数据对象中任意选择K个对象作为初始聚类中心;对剩下的对象,根据它们与这些聚类中心的距离,分别将它们分配给与其最近的聚类;然后重新计算每个新聚类的平均值作为新的聚类中心这个过程不断重复,直到准则函数收敛通常采用所有数据的均方差之和作为准则函数 3.1.2 FCM FCM 是K-means 的一个改进,区别在于聚类后样本的隶属度K-means 聚类的隶属度取值是 0 或 1,表明一个样本只能属于一个类别;而 FCM 聚类隶属度取值在 0-1 之间,一个样本对于所有类别的总的隶属度之和是 1 - 3 -3.1.3 层次聚类方法(Hierarchical Clustering,简写为 HC) 首先将每个对象作为一个聚类;然后将这些原子聚类进行聚合以构造越来越大的聚类,直到所有对象均聚合为一个聚类, 或满足一定终止条件为止 本文中层次聚类进行直到所有对象聚合为K个类中止 3.1.4 SOM SOM 网络自组织学习的基本原理为对于网络的每个输入模式,调整一部分网络的连接权值,使权值向量更加接近或偏离输入向量,该调整过程即为竞争学习过程通过学习,所有权值向量在输入向量空间中相互分离, 形成个子代表的输入模式, 实现特征自动识别的聚类分析功能。
3.2 聚类评价指标聚类评价指标 假设聚类得到K个客户类,kC表示每个聚类中所包含的公司集合,kpt表示该集合中的所有元素,kn表示每个聚类中包含的单位数目,每个聚类的代表曲线kCT为聚类中心,即隶属于该聚类中所有单位的代表负荷曲线的平均值,其中,1,2,...kK= 两条负荷曲线之间的距离定义如下: 232 121 , 2 , 01(,)()24obobobjobjjd PTPTPTPT ==−∑(1) 1I表征各聚类中心和其对应聚类中所有元素的距离的平均值[12 ], 定义如下: ()121,1Kkk kIdCT CK==∑, 其中211(,)(,)kn n kkkk nkd CT CdCTptn==∑2I表征各聚类紧密性与分辨性的比值之和[ 13 ],定义如下: 21 22111(,)(,)NKjiiik jkKidPT CTndCT CTI−===⎡⎤⎛⎞⎛⎞⎢⎥⎜⎟⎜⎟⎜⎟⎢⎥⎝⎠⎝⎠⎣⎦×=∑∑∑(2) 3I表示同一聚类中各元素之间的距离与各聚类中心之间的距离的比值,定义如下: 31/21/2 221,2,...,111111(,),()22knKKn ikkkiKknkkdptCdCTCTKnKI−====⎧⎫⎡⎤⎧⎫⎪⎪⎡⎤⎢⎥⎨⎬⎨⎬⎢⎥⎣⎦⎢⎥⎩⎭⎪⎪⎣⎦⎩⎭×=∑∑∑U (3) 较小的1I、2I、3I值表明聚类的效果较好。
3.3 聚类结果聚类结果 分别用几种聚类方法对数据进行聚类分析,假设聚类数目从 2~20,得到了各种方法的 聚类评价指标如图 1 所示 - 4 -从图中可以看出K-means、HC、SOM 方法的聚类结果很相近,并且使用K-means 方法在聚类数目为 8 时,取得最好的效果聚类结果如图 2 所示,由各聚类中包含的所有单位负荷曲线的平均值确定的是聚类中心, 在图中用红色粗线表示 各聚类中包含的单位数目范围为 52~149,从图中可以看出,聚类将所有的单位进行了有效的划分,各典型负荷曲线都代表了很多单位的负荷特性, 而且每条曲线之间都有比较明显的差别, 基本符合典型负荷模式的标准[14],故将其作为我们最终获取的典型负荷曲线用同样的方法可以得到周末情况下的典型负荷曲线,如图 3 所示 图 1 聚类结果比较 - 5 -4 规则推理规则推理 假设, , , MAXtMINtTPTPΔΔ和, AVtTPΔ分别表示在时段tΔ内的负荷最大值、最小值和平均值白天时段为从早上 8 点至晚上 6 点;午休时段为中午 12 点至下午 2 点;夜晚时段从晚上 10 点到早上 6 点文献[12]中提出了表征曲线形状特征的指标为: 图 2 工作日典型负荷曲线图 3 周末典型负荷曲线 - 6 -, , , 123, , , , , , 546, , , 11 35, , , , AVAVMINMAXAVMAXAVAVMINAVAVAVTPTPTPSSSTPTPTP TPTPTPSSSTPTPTP======日白天日日日白天夜晚午休白天日白天白天计算各单位负荷曲线指标,先将其进行模糊化,模糊化方法为各指标最大值与最小值之间 9 等分, 两端采用半梯形、 中间采用正三角形模糊隶属函数。
结合上面得到的聚类结果,以 6 个指标作为条件属性、以类别为决策属性,使用模糊粗糙集方法[15]进行属性约简,得到所有的 6 个指标的重要性[15]分别为:0.20、0.13、0.35、0.02、0.02、0.28,可以看出指标4、5 对决策的影响较小,可以略去整理得到只包含 4 个指标的规则集,然后删除其中相同的规则,最后删除每条分类规则中的多余属性,只保留必要的属性,对规则作进一步简化[16]得到最终的规则集,图 4 所示为规则集和规则前件的数目 使用本文的分类方法与 William Cohen 提出的 RIPPER 分类算法[17]以及 C4.5 决策树方法[ 11 ]分别对工作日和周末两个数据集进行 10 重交叉验证,结果如表 1 所示可以看出本文方法获取的规则集的分类效果好于这两种常用的分类方法,可以进行数据集的有效划分 工作日 周末 方法 本文方法RIPPERC4.5本文方法RIPPER C4.5 正确率(%) 81.20 75.48 74.6079.41 74.81 74.76 由于经济性等原因, 不可能在所有单位都安装智能表计设备, 于是我们可以根据单位的负荷曲线指标和上面获取的推理规则将某未知类型的单位划分到某典型负荷曲线类。
本文方法的基本流程如图 5 所示 表 1 分类规则比较 图 4 获取的规则 - 7 -初始 数据各单位负 荷曲线典型负荷 代表曲线将未知类型单 位进行分类预处 理选择合适的聚类 方法进行分析建立分 类规则5 结论结论 研究工商业用电特性, 对电力系统的经济运行和电力市场的发展有着重要的作用, 电力公司可以根据用电特性对工商业客户类别进行定义,针对不同的客户群制订相应的市场策略、提供相应的个性化的服务本文针对从杭州电力局获取的工商业客户用电数据,选取合理的聚类方法进行分析, 得到了典型负荷代表曲线 最终通过选取合适的分类方法获得分类规则用于将未知类型单位划分给某负荷曲线 本文分析的主要对象工商业用户、 收集数据的时间也较短, 收集更长时间段的负荷数据, 得到各季节典型负荷代表曲线是我们下一步将要进行的工作 参考文献参考文献 [1] 赵希正. 中国电力负荷特性分析与预测[M]. 北京: 中国电力出版社, 2002. [2] 冯丽, 邱家驹. 基于电力负荷模式分类的短期电力负荷预测[J].电网技术, 2005, 29(4): 23-26. [3] 姜勇. 南京地区春节负荷特性分析及其预测方法[J]. 电网技术, 2003, 27(5): 72-74. [4] 王明俊. 市场环境下的负荷管理和需求侧管理[J]. 电网技术, 2005,29(5): 1-5. [5] 石景海, 贺仁睦. 基于量测的负荷建模—分类算法[J]. 中国电机工程学报, 2004, 24(2): 78-82. [6] 孙雅明, 王晨力,张智晟, 等. 基于蚁群优化。












