[发明专利]一种基于语义特征抓取电网调度事件检测的方法和装置在审
申请号: | 202111393510.6 | 申请日: | 2021-11-23 |
公开(公告)号: | CN114201970A | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 张亮;翟海保;屈刚;葛敏辉;李慧星;许凌;金皓纯;杜宽;韩博文 | 申请(专利权)人: | 国家电网有限公司华东分部;北京科东电力控制系统有限责任公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/211;G06N3/04;G06N3/08;G06Q10/06;G06Q50/06 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 严志平 |
地址: | 200120 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 特征 抓取 电网 调度 事件 检测 方法 装置 | ||
1.一种基于语义特征抓取电网调度事件检测的方法,其特征在于,包括:
获取带有领域词汇和普通词汇的文本信息;
对所述文本信息进行训练处理,获得领域词汇表征信息和普通词汇表征信息;
训练所述领域词汇表征信息和普通词汇表征信息,获得基础数据文本信息;
对所述基础数据文本信息中的词汇进行处理,获取处理后文本信息;其中,所述处理内容包括对词汇进行标注、对词汇间的依赖关系进行分析、计算各类词汇距离头的距离;
将所述处理后的文本信息中涉及中文的信息进行算法验证,并通过混合表征算法进行训练;
将所述涉及中文的信息进行词汇划分,对词汇进行初步分类;
将所述初步分类的词汇信息输入预先构建的卷积神经网络,获取最终检测结果。
2.根据权利要求1所述的基于语义特征抓取电网调度事件检测的方法,其特征在于:对所述文本信息进行训练处理,获得领域词汇表征信息和普通词汇表征信息,包括:
根据Token-Level神经网络从领域词汇和普通词汇获取特征;
令T=t1,t2,...,tn其中ti是句子中的token数,并令xi是ti的嵌入和ti的相对位置到tc的串联,引入窗口大小为s的卷积层,以捕获组成语义,公式如下:
hij=tanh(wi·xj:j+s-1+bi) (1)
公式(1)显示卷积过程,其中wi是卷积层的滤波器,xi:i+j是嵌入层从xj到hj+s-1的串联,bi是偏置;
公式(2)通过使用动态多池来提供句子的不同部分的重要信号,其中关联tc左侧的汇集结果,关联tc右侧的汇集结果;通过连接和获取领域词汇的表征fbword;通过在普通词汇级序列上使用相同的过程,获得普通词汇的表征fnword。
3.根据权利要求1所述的基于语义特征抓取电网调度事件检测的方法,其特征在于:对所述基础数据文本信息中的词汇进行处理,获取处理后文本信息,包括:
通过POS对词汇进行词性标注,其中,POS是单词的词性;
通过DR对词汇间的依赖关系进行分析;
通过DIS算法计算各类词汇距离Head的距离。
4.根据权利要求1所述的基于语义特征抓取电网调度事件检测的方法,其特征在于:将所述处理后的文本信息中涉及中文的信息进行算法验证,并通过混合表征算法进行训练,公式如下:
αTi=s(WTif′char+UTif′word+VTif′F+bTi) (3)
αTc=s(WTcf′char+UTcf′word+VTcf′F+bTc) (4)
其中,s是sigmoid函数,W∈Rd′×d′w∈rd′×d′,U∈Rd′×dd′rd′×d′和V∈Rd′×d′v∈rd′d′是权重矩阵,B是偏置;
构建一个82维矢量f′F,获得特征和单词作为新的表示的串联:f′h=[f′F;′nword];
根据引入触发核生成器和事件类型分类器的栅格,获得作为输入的最终矢量,公式如下:
fTi=αTif′char+(1-αTi)f′h (5)
fTc=αTcf′char+(1-αTc)f′h (6)
其中fTi是触发识别的混合特征,fTc是事件类型分类器的混合功能,αTi和(1-αti)分别代表了触发识别中fchar′和f′h的重要性,αTc在事件类型分类器中扮演类似的作用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司华东分部;北京科东电力控制系统有限责任公司,未经国家电网有限公司华东分部;北京科东电力控制系统有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111393510.6/1.html,转载请声明来源钻瓜专利网。