[发明专利]一种电力领域隐患事件文本分类方法及其相关装置有效

专利信息
申请号: 202110859433.2 申请日: 2021-07-28
公开(公告)号: CN113535906B 公开(公告)日: 2023-01-17
发明(设计)人: 何超勋;杨秋勇;江疆;彭泽武;冯歆尧;吴金铭;王柳佳 申请(专利权)人: 广东电网有限责任公司
主分类号: G06F16/33 分类号: G06F16/33;G06F16/35;G06F40/279;G06Q50/06;G06N3/04;G06N3/08
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 沈闯
地址: 510080 广东省广州*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 电力 领域 隐患 事件 文本 分类 方法 及其 相关 装置
【说明书】:

本申请公开了一种电力领域隐患事件文本分类方法及其相关装置,构建包括有标签样本的风险隐患库和包括待分类样本的无标签样本库;通过预处理后的有标签样本对预置文本分类网络进行训练得到文本分类模型;通过文本分类模型对预处理后的待分类样本进行文本分类,根据分类类别概率获取置信度;将置信度最高的第一预置数量个待分类样本添加到风险隐患库,剩余待分类样本放回无标签样本库;通过文本分类模型对更新后的风险隐患库中有标签样本进行文本分类并获取置信度;将置信度最低的第二预置数据量个更新后的风险隐患库中的有标签样本添加到风险隐患库回收站,改善了现有的电力领域风险隐患事件文本采用人工审查方式,存在效率低和耗时长的技术问题。

技术领域

本申请涉及文本分类技术领域,尤其涉及一种电力领域隐患事件文本分类方法及其相关装置。

背景技术

电力供应关系民生,安全生产对电力企业尤为重要。虽然电力企业制定了安全规程,以规范电网运行过程,保障电网设备和人员安全。但事故和未遂事故仍时有发生,大量的事故事件记录的描述中暴露出操作过程中存在的问题。通过对这些文本记录的调查和统计分析,可以为采取有针对性的控制措施,防止事故的发生,提高安全管理和监督水平。然而,这些文本通常都是依赖于人工方式进行审查,效率低,费时长,工作量大。因此,提供一种电力领域隐患事件文本分类方法是本领域技术人员亟需解决的技术问题。

发明内容

本申请提供了一种电力领域隐患事件文本分类方法及其相关装置,用于改善现有的电力领域风险隐患事件文本采用人工审查方式,存在效率低和耗时长的技术问题。

有鉴于此,本申请第一方面提供了一种电力领域隐患事件文本分类方法,包括:

S1、构建包括有标签样本的风险隐患库和包括待分类样本的无标签样本库,所述有标签样本为有标签的电力领域风险隐患事件文本,所述待分类样本为无标签的电力领域事件文本;

S2、对所述有标签样本的置信度进行初始化,并对所述有标签样本进行预处理后,通过预处理后的所述有标签样本对预置文本分类网络进行训练,得到文本分类模型;

S3、从所述无标签样本库随机抽取若干所述待分类样本进行预处理后输入到所述文本分类模型进行文本分类,并根据所述待分类样本对应的分类类别概率获取该待分类样本的置信度;

S4、将置信度最高的第一预置数量个所述待分类样本添加到当前的风险隐患库,得到更新后的所述风险隐患库,剩余的待分类样本放回所述无标签样本库;

S5、通过所述文本分类模型对更新后的所述风险隐患库中的有标签样本进行文本分类,并基于更新后的所述风险隐患库中各有标签样本的分类类别概率获取置信度;

S6、将置信度最低的第二预置数据量个更新后的所述风险隐患库中的有标签样本添加到风险隐患库回收站,并返回步骤S3,直至所述无标签样本库中的样本数量为0。

可选的,所述预处理包括分词和/或去停用词。

可选的,所述预置文本分类网络包括前向长短期记忆网络、后向长短期记忆网络、注意力层、Dropout层和归一化层;

所述前向长短期记忆网络和所述后向长短期记忆网络的输出端均连接所述注意力层的输入端;

所述注意力层的输出端与所述Dropout层的输入端连接,并与所述归一化层跨越连接;

所述Dropout层的输出端与所述归一化层的输入端连接。

可选的,所述根据所述待分类样本对应的分类类别概率获取该待分类样本的置信度,包括:

将所述待分类样本对应的分类类别概率中的最高概率值作为该待分类样本的置信度。

可选的,步骤S6之后还包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司,未经广东电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110859433.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top