[发明专利]基于深度语义匹配的电力缺陷等级识别方法有效
申请号: | 201910020562.5 | 申请日: | 2019-01-09 |
公开(公告)号: | CN109740164B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 罗麟;位一鸣;袁海范;邓业;杨海波;潘巍巍 | 申请(专利权)人: | 国网浙江省电力有限公司舟山供电公司;国家电网有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F40/247;G06F16/35 |
代理公司: | 浙江翔隆专利事务所(普通合伙) 33206 | 代理人: | 王晓燕 |
地址: | 316021 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 语义 匹配 电力 缺陷 等级 识别 方法 | ||
本发明公开了一种基于深度语义匹配的电力缺陷等级识别方法,涉及电力缺陷等级识别技术领域。传统的文本分类模型有基于布尔值的向量空间模型,无法考虑深层次的上下文语义,向量稀疏,不具有可解释性等缺点,针对电力设备缺陷文本,分类精度不高。本方法采用深度神经网络将句子分为输入层、表示层、匹配层、排序层与输出层等五层结构,实现深度结构语义模型;然后在输入层基于word hashing和分词模型对文本进行预处理;再基于深度神经网络,依次训练了输入层、表示层、匹配层,得到缺陷文本的低维表示向量;最后基于cosin距离的语义相似度和TopK排序模型得到待分类文本的平均缺陷等级。有效提升缺陷文本的等级识别率,实现高精度的电力缺陷等级识别。
技术领域
本发明涉及电力缺陷等级识别技术领域,尤其涉及基于深度语义匹配的电力缺陷等级识别方法。
背景技术
在电力设备的日常运行与维护过程中,通常需要对电力设备的缺陷进行记录,记录内容通常包括缺陷设备类型、名称、缺陷发现日期、缺陷说明、缺陷分类等,从而形成大量的电力缺陷文本。与缺陷记录的其他内容不同,缺陷说明以短文本的形式进行记录,没有固定的格式与结构,但其包含了较为重要的缺陷信息,如设备发生缺陷的具体部件、缺陷的具体现象等,是对缺陷其他记录内容的重要补充,尤其是对于一些模糊性较强的缺陷,巡检人员都会将具体的缺陷信息以文本的形式详细记录在缺陷说明中,因此缺陷说明包含的信息对于缺陷的评估往往具有重要的价值。
按照电力设备缺陷分类标准,缺陷分类可按缺陷严重程度分为“一般”、“重要”和“紧急”三类,分类的任务一般由人工完成。通过机器学习的方法,利用现有的缺陷文本进行训练,挖掘缺陷说明中包含的具体缺陷信息,可以实现缺陷的自动分类。
与一般的中文文本相比,电力设备缺陷说明文本有以下的特点:
1)缺陷说明文本涉及电力设备专业领域内容,含有大量电气专业词汇,且由于巡检人员经验与习惯不同,对同一部件可能有不同的描述方式,如“储油柜”和“油枕”、“气体继电器”和“瓦斯继电器”等等。
2)由于各种缺陷的复杂性不同以及巡检人员记录详细程度的差异,各条缺陷说明的文本长度差别很大,最短的可少至4个词,最长的可达40多个词。
3)有相当一部分的缺陷说明文本中混杂着文字和数字,如“压力释放阀漏油,1分钟15到20滴”,这些包含量化信息的字段对缺陷等级的分类有着重要甚至决定性的作用。
4)缺陷说明文本的数据量大,有利于机器学习挖掘文本中隐含的规律,但同时也对分类模型的分类效率和存储开销提出了一定的要求。
传统的文本分类模型有基于布尔值的向量空间模型,其基本思想是用矩阵实现对句子集合的表示,矩阵的每一行代表一个句子的句向量,矩阵的列则表示句子的特征,每个句子的特征数一致;还有基于TF-IDF(词频-逆文档频率)的词频特征模型,即将分词形成的字典中的每个词作为一个特征,每个特征的权重由TF-IDF指标计算得到,权重的大小与对应的词在该句子中出现的频率以及在其他句子中出现的频率有关。除此之外,基于LDA(隐狄利克雷分布)的主题向量模型,即首先根据所有文本的内容生成若干个主题,每个主题作为一个特征,再根据句子与每个主题的相关度对每个特征赋予权重,从而得到句子的句向量。但是,以上传统方法无法考虑深层次的上下文语义,向量稀疏,不具有可解释性等缺点,进而导致分类精度不高,或者泛化能力较差。
发明内容
本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供基于深度语义匹配的电力缺陷等级识别方法,以实现高精度的电力缺陷等级识别为目的。为此,本发明采取以下技术方案。
基于深度语义匹配的电力缺陷等级识别方法,包括以下步骤:
1)构建深度结构语义模型,采用深度神经网络将句子从下往上可以分为五层结构,包括输入层、表示层、匹配层、排序层与输出层;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司舟山供电公司;国家电网有限公司,未经国网浙江省电力有限公司舟山供电公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910020562.5/2.html,转载请声明来源钻瓜专利网。