[发明专利]一种基于文本挖掘技术提取断路器故障特征信息的方法有效
申请号: | 201610004282.1 | 申请日: | 2016-01-06 |
公开(公告)号: | CN105677833B | 公开(公告)日: | 2019-03-12 |
发明(设计)人: | 黄绪勇;王闸;孙鹏;王秀利;耿苏杰 | 申请(专利权)人: | 云南电网有限责任公司电力科学研究院 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
地址: | 650217 云南省昆*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文本 挖掘 技术 提取 断路器 故障 特征 信息 方法 | ||
本发明公开的基于文本挖掘技术提取断路器故障特征信息的方法,包括:获取断路器故障信息,采用向量空间模型表示方法将其转化为计算机可识别的结构化信息,建立断路器故障文本;比较所述断路器故障文本内断路器故障信息的相似度,将所述断路器故障信息进行分类;统计词频,抽取高频词;结合供电企业信息系统中断路器采购记录资料以及高压断路器国家技术标准,自定义分词词库;基于词典匹配的方法,对分词后的断路器故障文本进行词性标注;将标注信息抽取和高频词汇补充相结合,识别和提取各类型故障的表征词;建立断路器故障表征信息与部件之间以及部件与部件之间的关联关系。有利于发现和提取导致故障发生的深层原因,为预防断路器故障提供依据。
技术领域
本发明涉及输变电设备管理技术领域,更为具体地说,涉及一种基于文本挖掘技术提取断路器故障特征信息的方法。
背景技术
断路器(circuit breaker)是指能够关合、承载和开断正常回路条件下的电流并能关合、在规定的时间内承载和开断异常回路条件下的电流的开关位置,在电力输送的过程中,起到重要作用。如此,在我国大型电网企业管理信息系统中,由各变电站节点输入的有关断路器故障描述文本形成了规模庞大的资料库。作为电力系统中最重要的开关设备之一,断路器由多个子部件组成,结构复杂,了解和掌握其常见的故障类型和表征信息,及其与部件之间的关联关系,可以帮助实现对断路器健康状态的实时监测,保证电力系统的安全与稳定运行,具有重要的经济和实际意义。
一般的网页和其它行业领域文本资料不同,电网企业信息系统中有关断路器故障信息的资料库在存储格式和记录方式上具有独特性。在存储格式上,企业信息系统中多以表格的形式存储断路器的故障历史信息。每行记录着一次断路器故障信息,由设备型号、生产厂家、投运时间、故障大类别、故障详细情况及原因分析等列记录模块构成,具有一定的结构化特征;其中故障详细情况及原因分析列记录是非结构化的文本描述。企业的每个地方分局(或变电站)所记录的故障详细情况及原因分析文本描述因人而异,呈现非结构化特征。
因此,如何从这些断路器故障半结构化文本资料中提取特征信息,准确建立故障类型和各部件之间的关联关系,实现断路器故障智能化分析成为供电企业信息系统亟待解决的技术问题。
发明内容
本发明的目的是提供一种基于文本挖掘技术提取断路器故障特征信息的方法,实现断路器故障智能化分析。
为了解决上述技术问题,本发明提供如下技术方案:
本发明提供的一种基于文本挖掘技术提取断路器故障特征信息的方法,所述方法主要包括:
获取断路器故障信息,采用向量空间模型表示方法将其转化为计算机可识别的结构化信息,建立断路器故障文本;
比较所述断路器故障文本内断路器故障信息的相似度,将所述断路器故障信息进行分类;
统计词频,抽取高频词;
结合供电企业信息系统中断路器采购记录资料以及高压断路器国家技术标准,自定义分词词库;
基于词典匹配的方法,对分词后的断路器故障文本进行词性标注;
将标注信息抽取和高频词汇补充相结合,识别和提取各类型故障的表征词;
建立断路器故障表征信息与部件之间、以及部件与部件之间的关联关系;
其中:分词词库包括供电企业所采用断路器的型号、部件标准名称、生产厂家以及常用的故障特征描述词等。
优选的,上述基于文本挖掘技术提取断路器故障特征信息的方法中,所述判断所述断路器故障文本内断路器故障信息的相似度,将所述断路器故障信息进行分类,具体包括:
采用jaccard相似度度量算法,将断路器的故障类型进行聚类和名称标准化,并据此对故障详细情况文本进行分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南电网有限责任公司电力科学研究院,未经云南电网有限责任公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610004282.1/2.html,转载请声明来源钻瓜专利网。