[发明专利]一种基于自然语言处理的调度应急知识管理的方法在审
申请号: | 202110254752.0 | 申请日: | 2021-03-09 |
公开(公告)号: | CN112925884A | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 颜少伟;李卓;符树雄;黎值源;张明;万凯;王俊;林寿南;熊彦清;王琳;陈模定;符瑜科;王铭伦;王哲 | 申请(专利权)人: | 海南电网有限责任公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/289;G06F40/30;G06F40/284;G06F40/211 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 颜希文 |
地址: | 570100 海*** | 国省代码: | 海南;46 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自然语言 处理 调度 应急 知识 管理 方法 | ||
1.一种基于自然语言处理的调度应急知识管理的方法,其特征在于,所述方法包括以下步骤:
S1、获取调度应急知识文本并对其进行预处理;
S2、对调度应急知识文本进行分词和注释;
S3、对调度应急知识文本进行语义分类和识别;
S4、对调度应急知识文本进行语义解析,提取调度应急知识文本中的有效信息及其语义成分类型,生成计算机可识别的对象化信息。
2.根据权利要求1所述的一种基于自然语言处理的调度应急知识管理的方法,其特征在于,所述步骤S1中,对调度应急知识文本进行预处理具体为:建立调度应急管理词库,通过统一规则表达对调度应急知识文本进行预处理。
3.根据权利要求2所述的一种基于自然语言处理的调度应急知识管理的方法,其特征在于,所述调度应急管理词库包括基本词库和组合词库,所述基本词库用于存储电气专业术语和特殊命名词,所述组合词库用于存储长度超过预设阈值且包含完整学术性语言描述的文本。
4.根据权利要求2所述的一种基于自然语言处理的调度应急知识管理的方法,其特征在于,所述步骤S2中,对调度应急知识文本进行分词和注释具体为:结合调度应急管理词库、分词规则和注释规则,对调度应急知识进行向量化。
5.根据权利要求4所述的一种基于自然语言处理的调度应急知识管理的方法,其特征在于,所述分词规则具体包括:
将符号与设备装置归为不同单元;
将长度最小的包含完整学术性语言描述的文本归为一个单元;
当调度应急管理文本为自然语言里出现频率最低的文本组合时,查询对应的电力调度常用说明作为分词依据;
若文本后出现包含于括号内的注释内容,将注释内容作为文本进行分词。
6.根据权利要求4所述的一种基于自然语言处理的调度应急知识管理的方法,其特征在于,所述注释规则具体为:使用条件随机场模型,根据调度应急知识文本生成一个长度为M的序列A=(a1,a2,…,aN),以及对应的标记序列B=(b1,b2,…,bN),条件随机场模型的表达式为:
其中λs表示第s个特征式的权数,fs为特征式,假设出现了一个特征满足解释第s个特征函数的内容,则该fs为1。
7.根据权利要求4所述的一种基于自然语言处理的调度应急知识管理的方法,其特征在于,步骤S3中对调度应急知识文本进行语义分类和识别具体为:将向量化的调度应急知识文本作为输入信息,根据建模产生全句的语义表示,结合事件语义方法预测调度应急知识文本所属的与任务相关的类别。
8.根据权利要求7所述的一种基于自然语言处理的调度应急知识管理的方法,其特征在于,所述事件语义方法具体为:根据调度应急知识文本全句的语义表示,判断其属于何种语句类型,所述语句类型包括调度操作安排、监控操作指示、开关跳闸信息、监控异常信息、现场异常信息、告警信号内容。
9.一种基于自然语言处理的调度应急知识管理的系统,其特征在于,所述系统包括:
预处理模块,用于获取调度应急知识文本并对其进行预处理;
分词注释模块,用于对调度应急知识文本进行分词和注释;
语句分类模块,用于对调度应急知识文本进行语义分类和识别;
语义解析模块,用于提取调度应急知识文本中的有效信息及其语义成分类型。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-8任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海南电网有限责任公司,未经海南电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110254752.0/1.html,转载请声明来源钻瓜专利网。