一种基于LSTM深度学习的95598话务工单预测与异动预警方法[发明专利]
(12)发明专利申请
(10)申请公布号 CN 109685240 A(43)申请公布日 2019.04.26
(21)申请号 201811247204.X(22)申请日 2018.10.24
(71)申请人 国网浙江省电力有限公司
地址 310007 浙江省杭州市西湖区黄龙路8
号
申请人 国网浙江省电力有限公司电力科学
研究院
浙江华云信息科技有限公司(72)发明人 罗欣 张爽 沈皓 景伟强
朱蕊倩 魏骁雄 陈博 麻吕斌 葛岳军 陈奕汝 钟震远 叶红豆 (74)专利代理机构 浙江翔隆专利事务所(普通
合伙) 33206
代理人 王晓燕
权利要求书2页 说明书11页 附图9页
(51)Int.Cl.
G06Q 10/04(2012.01)G06N 3/04(2006.01)
CN 109685240 A(54)发明名称
一种基于LSTM深度学习的95598话务工单预测与异动预警方法(57)摘要
本发明公开了一种基于LSTM深度学习的95598话务工单预测与异动预警方法,涉及一种电力话务工单分析方法。目前人为通过同比、环比数值、增幅数值来确定异动阀值,不能实时、准
导致监控预警、问题定位、确、科学地设定阀值,
趋势预测能力不足。本发明基于LSTM神经网络深度学习技术,通过建立科学的指标异动预测模型,研究各项指标的数理关系,实现短期话务工单置信异动预测与智能预警应用。本技术方案更高效、更精益、更智能地从大量指标中取得指标分析预警,提高客服指标分析与质量管控的工作效率。弥补传统曲线拟合建模需要定期模型修正的不足,支持在线实时动态学习预测与预警分析,提升日常指标的监控预警、问题定位、趋势预测能力。
CN 109685240 A
权 利 要 求 书
1/2页
1.一种基于LSTM深度学习的95598话务工单预测与异动预警方法,其特征在于包括以下步骤:
1)获取分时话务数据和日工单数据;2)对获取的样本数据进行分类;3)获取训练样本;
4)根据输入一段时序的话务工单量,LSTM神经网络深度学习,优化创建话务工单预测模型;在进行LSTM神经网络深度学习前,通过对某一时刻的话务工单理论预测值与话务工单真实值进行异动预判,通过置信异动系数来辅助判定,如果超过异动系数则表明该时刻话务工单发生异动现象,则该时刻增量模型学习时需对输入时间序列数据进行处理,发生异动时刻的话务工单数据被替换为上一轮该时刻的话务工单理论值,以避免时间序列增量学习异动数据导致预测结果理论值准确性偏低的情况;
5)根据获取的分时话务数据和日工单数据,对在线话务工单数据库采样;6)获取预测样本;
7)根据输入一段时序的话务工单量,通过话务工单预测模型进行话务工单预测;8)将步骤7)得到的预测结果输出。
2.根据权利要求1所述的一种基于LSTM深度学习的95598话务工单预测与异动预警方法,其特征在于:步骤4)包括以下子步骤:
401)定义学习模型参数,包括正则参数,迭代次数、学习速率、神经网络层数等;402)创建学习模型;
403)输入一段时序的话务工单量;404)数据归一处理;405)训练数据向量化,将一定时间序列的输入与目标输出按照已定义的学习模型参数进行向量数组实例化;
406)依次按供电单位、24小时或日类型、业务细分种类迭代学习;407)判断是否小于学习迭代次数;若到达迭代次数,则进入步骤411),否则,进入步骤408);
408)实时同步记录学习进度,包括当前学习次数、学习时间间隔;409)LSTM网络随机梯度下降分组学习,进行偏向与权重学习更新;410)分组学习完成重新初始化向量索引,返回步骤407);411)完成学习任务,将学习模型回写数据库。
3.根据权利要求2所述的一种基于LSTM深度学习的95598话务工单预测与异动预警方法,其特征在于:在步骤406)中,日类型包括工作日、周末、节假日;采用“一类一模型”的方式建立多个模型,以保证各个模型有针对性学习各自数据趋势轨迹以提高话务工单预测准确性。
4.根据权利要求2所述的一种基于LSTM深度学习的95598话务工单预测与异动预警方法,其特征在于:在步骤402)中,根据话务工单数据特征与预测业务需求,采用LSTM深度学习建模,设计LTSM神经网络模型结构与模型参数;
在LTSM深度学习算法结构设置中,设置6层网络结构,输入层神经元10个,隐藏层神经元数分别为200、100、200、100,输出目标为1,并选用tanh非线性函数作为隐含层的激活函
2
CN 109685240 A
权 利 要 求 书
2/2页
数,以identity函数为输出层激活函数。
5.根据权利要求2所述的一种基于LSTM深度学习的95598话务工单预测与异动预警方法,其特征在于:在步骤404)中,对各维度的时间序列样本输入数据进行归一化处理,将样本数据规范化至[0,1]的范围,当在数据预测过程中对目标输出进行反归一化,则计算公式如下:
式中:xi表示时间序列第i时刻的输入,x表示所有时间序列输入,yi表示归一化目标值。6.根据权利要求2所述的一种基于LSTM深度学习的95598话务工单预测与异动预警方法,其特征在于:在步骤409)中,LSTM神经网络深度学习训练采用随机梯度下降算法对所有参数进行统一训练,以调整隐含层参数并最终获得输出层参数;
LSTM神经网络深度学习训练目的是找到能最小化二次损失函数C(w,b)的权重和偏向;其中权重w和偏向b的更新规则方程如下:
其中Xk为所有话务工单学习训练样本中取第k个输入最小采样块,m为所有话务工单学习训练样本分割最小采样块总数,η为学习步长,l表示所在网络层,基于权重w微积分偏导,
为损失函数C(w,b)基于偏向b微积分偏导。
为损失函数C(w,b)
7.根据权利要求2所述的一种基于LSTM深度学习的95598话务工单预测与异动预警方法,其特征在于:在步骤401)中,通过在模型训练与预测过程中比对损失函数下降曲线趋势和准确率来权衡话务工单预测模型参数设置。
8.根据权利要求7所述的一种基于LSTM深度学习的95598话务工单预测与异动预警方法,其特征在于:Batch大小设置为30,迭代次数取值108;结合图中损失函数与准确率趋势,学习速率设置为0.01;正则参数设置为0.001;隐藏层的激活函数选择tanh函数;动量系数为0.95。
9.根据权利要求1所述的一种基于LSTM深度学习的95598话务工单预测与异动预警方法,其特征在于:在步骤4)中,设置的异动系数为20%;异动预警阀值公式如下:
ywarn=ytheory×(1+δwarn)
其中ywarn表示公式中定义的话务工单置信异动区间,ytheory表示话务工单理论预测值,则δwarn表示置信异动系数。
3
CN 109685240 A
说 明 书
1/11页
一种基于LSTM深度学习的95598话务工单预测与异动预警
方法
技术领域
[0001]本发明涉及一种电力话务工单分析方法,尤其涉及一种基于LSTM 深度学习的95598话务工单预测与异动预警方法。
背景技术
[0002]如何短期预测话务工单异动预警成为95598日常分析工作重点和难点之一,历来依靠人工检阅数据、手工清理数据进行指标预测等方式已严重跟不上发展需求,分析模式单一、效率低下、及时性差且浪费人力资源。目前人为通过同比、环比数值、增幅数值来确定异动阀值,不能实时、准确、科学地设定阀值,导致监控预警、问题定位、趋势预测能力不足。发明内容
[0003]本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供一种基于LSTM深度学习的95598话务工单预测与异动预警方法,以达到提高工作效率的目的。为此,本发明采取以下技术方案。
[0004]一种基于LSTM深度学习的95598话务工单预测与异动预警方法,其特征在于包括以下步骤:
[0005]1)获取分时话务数据和日工单数据;[0006]2)对获取的样本数据进行分类;[0007]3)获取训练样本;
[0008]4)根据输入一段时序的话务工单量,LSTM神经网络深度学习,优化创建话务工单预测模型;在进行LSTM神经网络深度学习前,通过对某一时刻的话务工单理论预测值与话务工单真实值进行异动预判,通过置信异动系数来辅助判定,如果超过异动系数则表明该时刻话务工单发生异动现象,则该时刻增量模型学习时需对输入时间序列数据进行处理,发生异动时刻的话务工单数据被替换为上一轮该时刻的话务工单理论值,以避免时间序列增量学习异动数据导致预测结果理论值准确性偏低的情况;[0009]5)根据获取的分时话务数据和日工单数据,对在线话务工单数据库采样;[0010]6)获取预测样本;
[0011]7)根据输入一段时序的话务工单量,通过话务工单预测模型进行话务工单预测;[0012]8)将步骤7)得到的预测结果输出。
[0013]本技术方案基于LSTM神经网络深度学习技术,通过建立科学的指标异动预测模型,研究各项指标的数理关系,实现短期话务工单置信异动预测与智能预警应用。更高效、更精益、更智能地从大量指标中取得指标分析预警,提高客服指标分析与质量管控的工作效率。弥补传统曲线拟合建模需要定期模型修正的不足,支持在线实时动态学习预测与预警分析,提升日常指标的监控预警、问题定位、趋势预测能力。实现远程工作站接派单坐席、抢修资源调度、日常质检坐席与指标分析专员等多方面实现技术创新代替人力密集,达到
4
CN 109685240 A
说 明 书
2/11页
减人增效的目的。
[0014]解决在时间序列学习预测过程中非正常异动突增话务工单数据对模型干扰而导致预测趋势变形问题,在时间序列学习预测过程中进行数据降噪,避免非正常异动突增话务工单数据剧烈波动影响预测模型。[0015]作为优选技术手段:步骤4)包括以下子步骤:[0016]401)定义学习模型参数,包括正则参数,迭代次数、学习速率、神经网络层数;[0017]402)创建学习模型;
[0018]403)输入一段时序的话务工单量;[0019]404)数据归一处理;[0020]405)训练数据向量化,将一定时间序列的输入与目标输出按照已定义的学习模型参数进行向量数组实例化;[0021]406)依次按供电单位、24小时或日类型、业务细分种类迭代学习;[0022]407)判断是否小于学习迭代次数;若到达迭代次数,则进入步骤 411),否则,进入步骤408);
[0023]408)实时同步记录学习进度,包括当前学习次数、学习时间间隔;[0024]409)LSTM网络随机梯度下降分组学习,进行偏向与权重学习更新;[0025]410)分组学习完成重新初始化向量索引,返回步骤407);[0026]411)完成学习任务,将学习模型回写数据库。[0027]作为优选技术手段:在步骤406)中,日类型包括工作日、周末、节假日;采用“一类一模型”的方式建立多个模型,以保证各个模型有针对性学习各自数据趋势轨迹以提高话务工单预测准确性。
[0028]作为优选技术手段:在步骤402)中,根据话务工单数据特征与预测业务需求,采用LSTM深度学习建模,设计LSTM神经网络模型结构与模型参数;[0029]在LSTM深度学习算法结构设置中,设置6层网络结构,输入层神经元 10个,隐藏层神经元数分别为200、100、200、100,输出目标为1,并选用tanh非线性函数作为隐含层的激活函数,以identity函数为输出层激活函数。[0030]作为优选技术手段:在步骤404)中,对各维度的时间序列样本输入数据进行归一化处理,将样本数据规范化至[0,1]的范围,当在数据预测过程中对目标输出进行反归一化,则计算公式如下:
[0031][0032]
式中:xi表示时间序列第i时刻的输入,x表示所有时间序列输入,yi表示归一化目
标值。
作为优选技术手段:在步骤409)中,LSTM神经网络深度学习训练采用随机梯度下降算法对所有参数进行统一训练,以调整隐含层参数并最终获得输出层参数;[0034]LSTM神经网络深度学习训练目的是找到能最小化二次损失函数C(w, b)的权重和偏向;
[0035]其中权重w和偏向b的更新规则方程如下:
[0033]
5
CN 109685240 A[0036][0037][0038]
说 明 书
3/11页
其中Xk为所有话务工单学习训练样本中取第k个输入最小采样块,m 为所有话务
为损失函数
工单学习训练样本分割最小采样块总数,η为学习步长,l表示所在网络层,C(w,b)基于权重w微积分偏导,
[0039]
为损失函数C(w,b)基于偏向b微积分偏导。
作为优选技术手段:在步骤401)中,通过在模型训练与预测过程中比对损失函数
下降曲线趋势和准确率来权衡话务工单预测模型参数设置。[0040]作为优选技术手段:Batch大小设置为30,迭代次数取值108;结合图中损失函数与准确率趋势,学习速率设置为0.01;正则参数设置为0.001;隐藏层的激活函数选择tanh函数;动量系数为0.95。
[0041]作为优选技术手段:在步骤4)中,设置的异动系数为20%;异动预警阀值公式如下:
[0042]ywarn=ytheory×(1+δwarn)
[0043]其中ywarn表示公式中定义的话务工单置信异动区间,ytheory表示话务工单理论预测值,则δ。warn表示置信异动系数。[0044]有益效果:[0045]一、本技术方案基于深度学习技术,通过建立科学的指标异动预测模型,研究各项指标的数理关系,实现短期话务工单置信异动预测与智能预警应用。更高效、更精益、更智能地从大量指标中取得指标分析预警,提高客服指标分析与质量管控的工作效率。弥补传统曲线拟合建模需要定期模型修正的不足,支持在线实时动态学习预测与预警分析,提升日常指标的监控预警、问题定位、趋势预测能力。实现远程工作站接派单坐席、抢修资源调度、日常质检坐席与指标分析专员等多方面实现技术创新代替人力密集,达到减人增效的目的。
[0046]二、解决在时间序列学习预测过程中非正常异动突增话务工单数据对模型干扰而导致预测趋势变形问题,在时间序列学习预测过程中进行数据降噪,避免非正常异动突增话务工单数据剧烈波动影响预测模型。[0047]三、解决了地域差异、业务差异、日时段峰谷及周末节假日差异等客观因素对话务工单预测的影响,攻克时间序列学习预测过程中非正常异动突增话务工单数据对模型干扰而导致预测趋势变形等技术难点,实现面向95598的时间序列预测与智能异动预警相结合的综合辅助支撑技术,弥补传统曲线拟合建模需要定期模型修正的不足,支持在线实时动态学习预测与预警分析,提升日常指标的监控预警、问题定位、趋势预测能力;[0048]四、可以以主流开源的DL4j深度学习技术突破口,所有功能实现组件式封装,扩展性较好,适应性强,同时对模型训练过程进行统一监控,所有建模参数功能实现可以通过前台页面配置完成,减少开发人员压力,提升需求响应及时性;[0049]五、本技术方案作为基于LSTM深度学习算法的话务工单预测与异动分析技术,融
6
CN 109685240 A
说 明 书
4/11页
合电力话务分时峰谷与业务差异化明细特点,并可进行需求个性化定制,话务预测功能具有24小时动态预测、实时模型学习修正、准确预判话务异动等特点,工单预测功能可具有实时模型学习修正和准确预判工单异动特点,同时具有日、周、月三个时间频度,涉及业务工单数据根据国家电网95598业务类型分类,包括故障报修、业务咨询、投诉、举报、建议、意见、服务申请、表扬,同时这些业务细分。直观性好,准确性高。附图说明
[0050]图1是本发明的流程图。
[0051]图2是本发明的基于LSTM深度学习算法的话务工单预测模型结构图。[0052]图3是本发明的训练过程中不同学习速率与损失函数对比结果图。[0053]图4是本发明的训练过程中不同学习速率与准确率对比结果图。[0054]图5是本发明的不同正则参数(L2)与损失函数对比结果图。
[0055]图6是本发明的训练过程中不同学习速率与准确率对比结果图。[0056]图7是本发明的训练过程中不同激活函数与准确率对比结果图。[0057]图8是本发明的训练过程中不同动量系数与准确率对比结果图。[0058]图9是本发明的未经修正的话务学习预测异动预警图。[0059]图10是本发明的经修正的话务学习预测异动预警图。[0060]图11是本发明的训练过程中损失函数与准确率关系图。[0061]图12是本发明的近100天话务预测趋势图。
[0062]图13是本发明的用电异常核实工单预测异动趋势图。[0063]图14是本发明的话务预测与异动预警功能界面图。[0064]图15是本发明的工单预测与异动预警功能界面。[0065]图16是LSTM神经网络细胞的结构原理图。
具体实施方式
[0066]以下结合说明书附图对本发明的技术方案做进一步的详细说明。[0067]如图1所示,本发明包括以下步骤:[0068]1)获取分时话务数据和日工单数据;[0069]2)对获取的样本数据进行分类;[0070]3)获取训练样本;
[0071]4)根据输入一段时序的话务工单量,LSTM神经网络深度学习,优化创建话务工单预测模型;在进行LSTM神经网络深度学习前,通过对某一时刻的话务工单理论预测值与话务工单真实值进行异动预判,通过置信异动系数来辅助判定,如果超过异动系数则表明该时刻话务工单发生异动现象,则该时刻增量模型学习时需对输入时间序列数据进行处理,发生异动时刻的话务工单数据被替换为上一轮该时刻的话务工单理论值,以避免时间序列增量学习异动数据导致预测结果理论值准确性偏低的情况;其包括以下子步骤:[0072]401)定义学习模型参数,包括正则参数,迭代次数、学习速率、神经网络层数等;[0073]402)创建学习模型;
[0074]403)输入一段时序的话务工单量;
7
CN 109685240 A[0075]
说 明 书
5/11页
404)数据归一处理;
[0076]405)训练数据向量化,将一定时间序列的输入与目标输出按照已定义的学习模型参数进行向量数组实例化;[0077]406)依次按供电单位、24小时或日类型、业务细分种类迭代学习;[0078]407)判断是否小于学习迭代次数;若到达迭代次数,则进入步骤 411),否则,进入步骤408);
[0079]408)实时同步记录学习进度,包括当前学习次数、学习时间间隔;[0080]409)LSTM网络随机梯度下降分组学习,进行偏向与权重学习更新;[0081]410)分组学习完成重新初始化向量索引,返回步骤407);[0082]411)完成学习任务,将学习模型回写数据库;[0083]5)根据获取的分时话务数据和日工单数据,对在线话务工单数据库采样;[0084]6)获取预测样本;
[0085]7)根据输入一段时序的话务工单量,通过话务工单预测模型进行话务工单预测;[0086]8)将步骤7)得到的预测结果输出。
[0087]本发明通过基于LSTM深度学习的话务工单预测算法模型、话务工单预测模型的机器学习训练、模型参数最优配置策略、话务工单预测与异动预警实现四个关键环节完成的一种基于LSTM深度学习算法的95598话务工单预测与异动预警方法,构建面向95598的时间序列预测与智能异动预警相结合的综合辅助支撑技术,提高95598指标分析与质量管控的工作效率。
[0088]以下就具体步骤作详细说明:[0089](1)基于LSTM深度学习的话务工单预测算法模型:该过程实现根据话务工单数据特征与预测业务需求,采用LSTM深度学习建模,设计LSTM 神经网络模型结构与模型参数。[0090]在LTSM深度学习算法结构设置方面,本技术方案设置6层网络结构,输入层神经元10个,隐藏层神经元数分别为200、100、200、100,输出目标为1,并选用tanh非线性函数作为隐含层的激活函数,以identity函数为输出层激活函数。[0091]如图2所示,{d,y}表示输入变量和输出变量,其中d[d0,d2,..., d9],d0,...,d9分别表示t时,t-1时,...,t-9时话务量,y为t+1 时输出话务量或者t日,t-1日,...,t-9日工单量,y为t+1日输出工单量。mi、fi、wi和bi分别表示第i层神经元的数量、激活函数、权重和偏向;li表示第i层神经元的输出,也是li层神经元的输入;l0表示预测模型的输入l0[d0,d2,...,d9],预测模型的输出是末层神经元的输出 l5的y。每一层的输出li与输入li-1、fi、wi和bi的关系如公式(1)所示:[0092]li=fi(wili-1+bi)[0093](1)[0094](2)话务工单预测模型的深度学习训练:该过程根据上述话务工单预测模型实现训练样本数据分类及归一处理、随机梯度下降学习训练策略优化来完成深度学习训练。95598话务数据受单位地域差异、24小时段及工作日与非工作日等客观因素差异明显,同时工单数据还需考虑各业务子类间的差异;因此话务数据按照供电单位、24小时制、日类型(工作日、周末、节假日)多种维度进行样本数据分类,工单数据则按照供电单位、业务分类、日类型(工作日、周末、节假日)多种维度进行样本数据分类。
8
CN 109685240 A[0095]
说 明 书
6/11页
充分考虑到学习训练过程中激活函数sigmoid和tanh函数的特性,减少数据训练
过程中的时间消耗和资源占用,则在机器学习训练过程对各维度的时间序列样本输入数据进行归一化处理,将样本数据规范化至[0,1] 的范围,当在数据预测过程中对目标输出进行反归一化,则计算公式如下:
[0096]
[0097]
式中:xi表示时间序列第i时刻的输入,x表示所有时间序列输入,yi表示归一化目
标值。
话务工单预测模型的机器学习训练采用随机梯度下降算法 (Stochastic Gradient Descent)对所有参数进行统一训练,以调整隐含层参数并最终获得输出层参数。[0099]话务工单预测模型学习训练目的是找到能最小化二次损失函数C(w, b)的权重和偏向。其中权重w和偏向b的更新规则方程如下:
[0100][0098]
[0101]
[0102]
其中Xk为所有话务工单学习训练样本中取第k个输入最小采样块,m 为所有话务
为损失函数
工单学习训练样本分割最小采样块总数,η为学习步长,l表示所在网络层,C(w,b)基于权重w微积分偏导,
[0103]
为损失函数C(w,b)基于偏向b微积分偏导。
(3)模型参数最优配置策略:该过程实现在有限的硬件资源条件下对模型所涉及的关键参数进行最优配置,通过在模型训练与预测过程中比对损失函数下降曲线趋势和准确率来权衡模型参数设置。为了更好适应实际应用,通过多次实验测试获得更好的性能参数。根据实验反复验证, Batch大小设置为30,准确率相对稳定。其中1个Epoch表示所有的训练样本数据全部通过网络训练一次。具体的模型参数配置见表1所示。[0104]表1 LSTM深度学习模型训练参数
9
CN 109685240 A[0105]
说 明 书
7/11页
[0106]
从图3-4可以看出,不同的学习速率对损失函数和准确率影响明显, Epoch值达到
108左右损失函数趋于稳定,则迭代次数(iterations)取值 108;同时结合图中损失函数与准确率趋势,则学习速率设置为0.01。[0108]从图5-6可以看出,不同L2正则参数对损失函数影响相对明显,但对准确率影响相对较少,则正则参数(L2)设置为0.001。[0109]如图7所示,不同的激活函数对准确率影响明显,从图趋势可以看出隐藏层的激活函数应该选择tanh函数。[0110]如图8所示,不同动量系数对准确率影响相对较少,则动量系数采用默认设置为0.95,则有利于更快的性能来递归神经网络模型。[0111](4)话务工单预测与异动预警实现:该过程根据上述深度学习模型实现话务工单预测与制定异动预警算法,同时针对时间序列学习预测过程中非正常异动突增话务工单数据对模型干扰而导致预测趋势变形情况,制定动态判断与学习修正策略。[0112]通过上述机器学习训练的话务工单预测模型,可实现话务工单随着时间自适应学习进行动态智能预测,但目标输出的话务工单数据只能作为理论预测值,将预测值上限与下限作为合理置信区间,根据实际业务需求设置异动预警系数,则异动预警阀值公式如下:[0113]ywarn=ytheory×(1δwarn)[0114](5)
[0115]其中ywarn表示公式中定义的话务工单置信异动区间,ytheory表示话务工单理论预测值,则δ默认取20%。warn表示置信异动系数,
[0107]
10
CN 109685240 A[0116]
说 明 书
8/11页
基于时间序列不断学习预测过程中,避免非正常异动突增话务工单数据对模型干
扰而导致预测趋势变形情况,需要对样本预测数据进行自动修正处理。[0117]如图9所示,某单位某日11点至18点出现话务明显突增,如果在机器学习预测过程依旧话务突增数据作为输入样本数据,则会出现图4所示13 点至17点的理论预测值与预警阀值曲线明显变形,从而影响话务异动自动预警诊断。通过对话务突增明显的数据进行理论值自动修正,可采取昨日同时段同单位的理论预测值作为该异动修正值,如图10所示13点至17点的理论预测值与预警阀值曲线显示正常。
[0118]为避免时间序列增量学习异动数据导致预测结果理论值准确性偏低的情况,即在时间序列学习预测过程中进行数据降噪,避免非正常异动突增话务工单数据剧烈波动影响预测模型。通过对某一时刻的话务工单理论预测值ytheory与话务工单真实值yteue进行异动预判,通过上述所提到的置信异动系数δ如果超过异动系数则表明该时刻warn来辅助判定,话务工单发生异动现象,则该时刻增量模型学习时需对输入时间序列数据进行处理,发生异动时刻的话务工单数据被替换为上一轮该时刻的话务工单理论值,这样可以避免时间序列增量学习异动数据导致预测结果理论值准确性偏低,具体见上述话务工单预测与异动预警实现内容。
[0119]为保证话务工单预测准确性,即如何面对各单位、各时段、工作日/ 非工作日、各业务子类等多重维度数据差异明显情况下保证话务工单预测准确性。本技术方案综合考虑与技术研究,其中话务数据按照供电单位、 24小时制、日类型(工作日、周末、节假日)多种维度进行样本数据分类,工单数据则按照供电单位、业务分类、日类型(工作日、周末、节假日) 多种维度进行样本数据分类。采用“一类一模型”的思路保证各个模型有针对性学习各自数据趋势轨迹,累计机器自动建模5万余个。
[0120]为解决系统自动建模数量与性能瓶颈技术问题,即机器自动累计建模 5万多个则对硬件的内存和CPU带来极大的考验,在业务要求上保证在一定频率内输出预测结果。在有限的硬件资源条件下对模型所涉及的关键参数进行最优配置,通过在模型训练与预测过程中比对损失函数下降曲线趋势和准确率来权衡模型参数设置,具体见上述模型参数最优配置策略实现。
[0121]举例说明:在对某地市公司7点时段近150天话务样本机器学习训练过程发现损失函数得分与训练准确率之间的存在紧密关联关系,如图11所示,损失函数得分随着迭代次数的增加而趋于稳定,训练的准确率会随着训练迭代次数的增加而逐步增加,最终稳定的训练准确性预测结果为91.08%左右。[0122]如表2所示,使用准确率P,平均绝对百分比误差EMAPE分析评价指标对某地市公司工作日与非工作日话务预测结果进行评价。从表中数据可以看出总体预测结果符合预期结果,预测准确率在90.19%以上,这其中并未排除不可预见人为因素引起话务波动,导致模型预测结果发生偏移。
[0123]表2话务工作日与非工作预测结果对比
[0124]
11
CN 109685240 A[0125]
说 明 书
9/11页
以上可知,本技术方案:一是解决了地域差异、业务差异、日时段峰谷及周末节假
日差异等客观因素对话务工单预测的影响,攻克时间序列学习预测过程中非正常异动突增话务工单数据对模型干扰而导致预测趋势变形等技术难点,实现面向95598的时间序列预测与智能异动预警相结合的综合辅助支撑技术,弥补传统曲线拟合建模需要定期模型修正的不足,支持在线实时动态学习预测与预警分析,提升日常指标的监控预警、问题定位、趋势预测能力;二是以主流开源的DL4j深度学习技术突破口,所有功能实现组件式封装,扩展性较好,适应性强,同时对模型训练过程进行统一监控,所有建模参数功能实现可以通过前台页面配置完成,减少开发人员压力,提升需求响应及时性;
[0127]三是它作为基于LSTM深度学习算法的话务工单预测与异动分析技术,融合电力话务分时峰谷与业务差异化明细特点,并进行需求个性化定制,话务预测功能具有24小时动态预测、实时模型学习修正、准确预判话务异动等特点,具体功能界面见图14话务预测与异动预警功能界面;工单预测功能具有实时模型学习修正和准确预判工单异动特点,同时具有日、周、月三个时间频度,涉及业务工单数据根据国家电网95598业务类型分类,包括故障报修、业务咨询、投诉、举报、建议、意见、服务申请、表扬。同时这些业务细分有418种,如表3所示,具体功能界面见图15工单预测与异动预警功能界面。[0128]表3 95598业务细分种类对应表[0129]单位:项
[0126]
12
CN 109685240 A[0130]
说 明 书
10/11页
而这一关键技术在实际应用主要表现为以下三方面:(1)基于深度学习技术,通过
建立科学的指标异动预测模型,研究各项指标的数理关系,实现短期话务工单置信异动预测与智能预警应用。更高效、更精益、更智能地从大量指标中取得指标分析预警,提高客服指标分析与质量管控的工作效率。(2)弥补传统曲线拟合建模需要定期模型修正的不足,支持在线实时动态学习预测与预警分析,提升日常指标的监控预警、问题定位、趋势预测能力。(3)实现远程工作站接派单坐席、抢修资源调度、日常质检坐席与指标分析专员等多方面实现技术创新代替人力密集,达到减人增效的目的。[0132]以下就LSTM网络深度学习技术作概述
[0133]长短期记忆神经网络(LSTM)是一种改进的时间序列循环神经网络 (Recurrent Neural Network,RNN),由Sepp Hochreiter和Juergen Schmidhuber提出了循环网络的一种变体,带有所谓长短期记忆单元,可 以解决梯度消失的问题。LSTM可以学习时间序列长短期依赖信息,由于 神经网络中包含时间记忆单元,因此适用于处理和预测时间序列中的间隔 和延迟事件。
[0134]LSTM将信息存放在循环网络正常信息流之外的门控单元中。这些单元可以存储、写入或读取信息,就像计算机内存中的数据一样。单元通过门的开关判定存储哪些信息,以及何时允许读取、写入或清除信息。LSTM 网络的记忆功能就是由各层的阀门节点实现的。阀门有3类:遗忘门、输入门和输出门。输入门从外部接受新的输入并处理新来的数据;遗忘门决定何时忘记输出结果,从而为输入序列选择最佳时间延迟;输出门将计算所有结果并为LSTM网络单元生成输出;这些阀门可以打开或关闭,用于将判断模型网络的记忆态(之前网络的状态)在该层输出的结果是否达到阈值从而加入到当前该层的计算中。如图1中所示,阀门节点利用sigmoid 函数将网络的记忆态作为输入计算;如果输出结果达到阈值则将该阀门输出与当前层的计算结果相乘作为下一层的输入;如果没有达到阈值则将该输出结果遗忘掉。每一层包括阀门节点的权重都会在每一次模型反向传播训练过程中更新。[0135]这些门依据接收到的信号而开关,而且与神经网络的节点类似,它们会用自有的权重集对信息进行筛选,根据其强度和导入内容决定是否允许信息通过。这些权重就像调制输入和隐藏状态的权重一样,会通过循环网络的学习过程进行调整。也就是说,记忆单元会通过猜测、误差反向传播、用梯度下降调整权重的迭代过程学习何时允许数据进入、离开或被删除。
13
[0131]
CN 109685240 A[0136]
说 明 书
11/11页
如图16所示,将输入时间序列表示为X=(x1,x2,...,xn),存储单元的隐藏状态为H
=(h1,h2,...,hn),输出时间序列为Y= (y1,y2,...,yn),LSTM神经网络的计算如下:[0137]ht=H(Whxxt+Whhxt-1+bh)[0138]式中:ht表示t时刻隐藏单元状态的输出,Whx表示时间序列输入xt到隐藏单元状态ht之间的权重向量,Whh表示隐藏单元状态ht与ht-1之间的权重向量,ht-1表示t前一时刻的隐藏单元状态输出,bh表示隐藏单元状态输出ht的偏差。[0139]pt=Whyyt-1+by[0140]式中:Why表示隐藏单元状态ht到输出时间序列yt-1之间的权重向量, yt-1表示t前一时刻输出时序数据,pt表示t时刻目标预测输出,by表示目标预测输出pt的偏差。[0141]进一步分解,其中隐藏单元状态在下面的公式中计算:[0142]it=σ(Wixxt+Whhht-1+Wicct-1+bi)[0143]式中:it输入阀门,Wix表示时间序列输入xt到输入阀门it之间的权重向量,Whh表示隐藏单元状态ht与ht-1之间的权重向量,Wic表示输入阀门it到cell状态输出ct-1之间的权重向量,bi表示输入阀门it的偏差。[0144]ft=σ(Wfxxt+Whhht-1+Wfcct-1+bf)[0145]式中:ft遗忘阀门,Wfx表示时间序列输入xt到遗忘阀门ft之间的权重向量,Wfc表示遗忘阀门ft到cell状态输出ct-1之间的权重向量,bf表示遗忘阀门ft的偏差,σ表示sigmoid函数。
[0146]ct=ft*ct-1+it*g(Wcxxt+Whhht-1+Wccct-1bc[0147]式中:ct表示cell状态输出,ct-1表示前一时刻cell状态输出,Wcx表示时间序列输入xt到前一时刻cell状态输出ct-1之间的权重向量,Wcc表示cell状态输出ct到前一时刻cell状态输出ct-1之间权重向量,bc表示 cell状态输出ct的偏差,g为sigmoid函数范围为[-2,2]。
[0148]ot=σ(Woxxt+Whhht-1+Wocct-1+bo)[0149]式中:ot表示输出阀门,Wox表示时间序列输入xt到输出阀门ot之间的权重向量,Woc表示输出阀门ot之间的权重向量到cell状态输出ct的权重向量,bo表示输出阀门ot的偏差。[0150]ht=ot*h(ct)[0151]式中:*表示两个向量或矩阵的标量乘积,h为sigmoid函数范围为 [-1,1]。
[0152][0153][0154]
对于目标函数,使用由以下公式表示平方损失函数:
附图1所示的一种基于LSTM深度学习的95598话务工单预测与异动预警方法是本发明的具体实施例,已经体现出本发明实质性特点和进步,可根据实际的使用需要,在本发明的启示下,对其进行等同修改,均在本方案的保护范围之列。
[0155]
14
CN 109685240 A
说 明 书 附 图
1/9页
图1
图2
15
CN 109685240 A
说 明 书 附 图
2/9页
图3
图4
16
CN 109685240 A
说 明 书 附 图
3/9页
图5
图6
17
CN 109685240 A
说 明 书 附 图
4/9页
图7
图8
18
CN 109685240 A
说 明 书 附 图
5/9页
图9
图10
19
CN 109685240 A
说 明 书 附 图
6/9页
图11
图12
20
CN 109685240 A
说 明 书 附 图
7/9页
图13
图14
21
CN 109685240 A
说 明 书 附 图
8/9页
图15
22
CN 109685240 A
说 明 书 附 图
9/9页
图16
23
因篇幅问题不能全部显示,请点此查看更多更全内容