正文约4500字,预估用时9分钟。
电网公司历来重视客户服务和体验。在云大物移智链新一代数字技术下,如何妙用技术之力,精确定位优质客户,科学配置服务资源,对电网公司的优质客户服务提出了更高要求。本文重点围绕存量优质客户,通过大数据机器学习的方法和实践,“术”眼识别优质客户,优化服务策略匹配,确保存量优质客户不会流失。
文中图表数据基于某省电网公司,已做脱敏处理。由于各地具体情况不同,技术路线可以复用,但效果可能存在差异,需要结合实际情况迭代优化。
◆ ◆ ◆ ◆
01
基于传统经验识别优质客户
电力优质客户能够为电力企业带来较大的价值,这类客户具有用电量大、负荷稳定等特点。以某省电网公司为例,2015年具有10kV以上高压用户57.1万户,占总营业户数的1.51%,但电量及电费的贡献度达到了全公司91%以上。
那么,基于传统经验是如何识别优质客户的?
通常只能靠专家经验。而仅凭专家个人的主观判断,可能存在以下问题:
首先,每个专家的判定标准与尺度各不相同。有些专家认为电力客户的到户售电均价高于该地区年到户售电均价,它就是一个优质客户;而有些专家则认为用电量越大的客户越优质;还有一些专家认为没有违约用电和违法窃电的客户才是优质的。
其次,地区行业企业发展差异也使得优质客户的判定标准无法完全一致。以用电量为例,有的地区以年累计用电量大于100万千瓦时的用户为优质,而工业企业相对发展较缓慢的地区,则以累计电量大于50万千瓦时的用户为优质客。
再次,仅凭专家经验去判定电力客户是否优质,偏主观,并且有些人为因素不可控。如电力客户跟客户经理的关系更紧密,更容易被评定为比较高的优质客户等级。
综上,单凭专家经验去做优质客户判定是不合适的,可能会影响到客户服务工作的公平性和公正性。因此,如何把专家主观经验抽象出来,变成一种共识,构建更为客观的识别规则固化下来?而将专家经验进行抽象,固化为通用的规则,则是大数据机器学习技术最为擅长的解题领域。
02
运用大数据技术识别优质客户
(一)选择有监督机器学习技术更合适
初看“优质客户识别”课题,容易认为就是一个用户分类的问题:把客户分为“优质”和“非优质”的,再从“优质”中分出“一般优质”、“较为优质”、“非常优质”,似乎非常适用聚类算法,聚类出不同的用户群体就可以了。
但是实际情况却是,这不仅是一个纯研究探索类项目,聚类结果需要得到用户认可,必须具有真正的实用化价值。也就是说,聚类得出的优质客户,如果用户不认,那么之前所有的努力就会付之一炬。原因在于聚类算法是无监督的大数据分析方法,无法在建模之初,对模型输出的目标形成有效共识。而大多数的客户在最终的模型输出时会要求用业务关系来解释分析结论,但聚类并不能很好地提供这样的依据。
我们通过研究发现,把无监督学习的建模思路转化成有监督学习模式,通过让用户提供一定数量的客户样本数据,在这些样本数据里,要求必须同时有基于专家经验判定的优质客户和非优质客户。
因此,在电力大数据应用实践中,特别是涉及到分类问题,可以更多考虑采用有监督的机器学习方法来进行建模。
(二)利用大数据技术全面分析客户特征
传统方法在判断客户是否优质时,主要是通过“量”、“费”、“容量”等某几个具体的业务指标来实现。例如,此前某电网公司对优质客户的管理规定主要的判断依据就是“全年用电总量”以及“未发生过欠费”这两个指标。
但现实情况是,专家对样本客户是否优质的判定还会考虑到其它的因素,例如缴费的及时性、电费的预收情况等。即在有监督机器学习里,大数据建模过程中的样本数据观测及特征分析能够充分挖掘出专家在判断优质客户时的考虑因素,能够更全面地分析这些客户特征。
在下面的“样本数据观测及特征分析”章节,我们将看到通过分析优质客户样本平均电价、电量、边际成本、力调系数分布、负荷价值等方面的规律,挖掘出了更多的关于优质客户及星级评定的相关特征。
03
机器学习识别具体做法详解
(一)主要思路
根据电力市场新形势下电网公司的企业发展战略,按照价值链导向开展优质客户分析,采取了以专家经验为基础选择有代表性的样本数据,构建优质客户特征筛查体系及分级评价模型的思路,通过纠正样本、模型迭代,不断优化提升模型的准确度,并应用模型评定优质客户星级。
图1 构建思路
(二)具体做法
1、样本数据筛选及评定
依据我公司多年开展客户服务、定制化个性服务、节能服务、助力企业节支增收等大量精准服务实际经验,选取某地区高压客户作为该课题数据,设计样本选取过程如下:
2、样本数据观测及特征分析
通过分析优质客户样本平均电价、电量、边际成本、力调系数分布、负荷价值等方面的规律,挖掘优质客户及星级评定的相关特征。
(1)平均电价对比情况分析
对地区客户、样本客户近一年到户的售电均价进行分析,结果如下:
图2 售电均价对优质客户影响分析
(2)电量分布对比情况
对样本客户全年累计电量进行分析,优质客户与非优质客户的电量分布情况如下:
图3 优质客户电量分布
从图发现,累计电量对于专家评定客户是否优质具有强关联性。年累计电量大于100万千瓦时的客户有99.5%的客户被评定为优质客户,优质与非优质客户的边界电量可以定为100万千瓦时。采用同样的方法对客户额定容量进行分析,发现优质客户与非优质客户的分界值在315kVA。
(3)边际成本分布对比情况
通过分析5000户样本销售均价、地区高压客户销售均价、优质客户的销售均价,形成购销价格分析趋势表。(单位:元/千瓦时)
图4 边际成本对优质客户影响分析
(4)力调系数分布对比情况
分析样本数据中,优质客户功率因数调整系数分布情况:
图5 力调系数对优质客户影响分析
(5)用电负荷分析
目前电力客户用电时段相对集中,造成电网高峰缺负荷,低谷窝负荷,峰谷差越来越大。通过对地区高压客户用电负荷分析,发现适合削峰填谷的用户及特征。
图6 用电负荷对优质客户影响分
地区析年平均负荷率为0.6152左右。
通过样本数据的全面观测和特征分析,提炼总结出经济价值、发展价值、信用价值、负荷价值四个维度共计38个特征指标。
3、优质客户模型构建
在初步筛选的客户范围中使用大数据分析识别方法做精准的优质客户筛选及星级细分。模型构建分为数据处理、模型训练、模型验证、模型迭代优化4个环节。
对收集到的客户数据进行数据质量分析,通过数据超限值检验、特征有效性检验、数据空值检验,对数据进行清洗。
结合优质客户识别的业务目标,选择典型的有监督学习算法开展模型训练。应用随机森林、XGB、逻辑回归、决策树、支持向量机等多种机器学习算法,开展模型训练及自验证。随机森林模型训练结果好于其他四种模型,作为优质客户识别主模型,并以逻辑回归算法来细分优质客户等级。
图7 模型偏差率
开展模型的交叉验证,将全部样本平均拆分成10份,每次选择其中9份作为训练样本,剩余1份作为预测样本,循环迭代10次。从模型稳定性和准确性两个维度开展模型有效性分析。
通过专家监督开展模型判定结果纠正,不定期对模型判定结果进行有效性分析,在分析结果基础上,通过重新训练模型达到模型版本升级及优化的目的,构建模型版本升级优化的长效机制。
4、优质客户等级评定
基于优质客户评价特征体系及优质客户识别模型,计算特征贡献度和客户综合价值得分,根据样本数据不同星级客户综合评分落点,进行星级区间划分。
图8 模型应用
模型构建完成后,依照模型对全地区高压客户进行判定,优质客户占比6.7%,其中:一星客户占比55.87%;二星客户占比24.02%;三星客户占比13.6%;四星客户占比4.51%;五星客户占比2%。
04
应用价值
优质客户服务体系涵盖客户用电售前、售中和售后全过程服务诉求和匹配的服务策略,实施过程中能够站在客户角度快速有效解决客户用电问题和短板,助力客户星级提升,享受更超值的服务,从而进一步挖掘客户价值。
通过大数据技术建立优质客户识别模型,制定星级评定标准,快速识别客户的优质星级,围绕客户需求关注点,实施优质客户竞争策略推送应用,实现“大数据+供电服务”的深度融合。
通过成立园区中心、增设客户经理、搭建“一对一”大客户微信服务平台、线上渠道服务需求收集等服务举措,提升优质客户满意度和忠诚度,增强优质客户服务粘性。
通过用电诊断,电量分析等,助力客户降低用电成本,帮助客户算好电费账、安全账、负荷账、能效账。
本文的模型构建主要是存量的优质客户,在识别后如何去增加其粘性,保证其不流失。对于增量优质客户识别存在模型构建方法和应用方法上的差异,需要进一步深入研究探讨,也欢迎大家交流切磋。
【俞孙霁管理分析业务部】