[发明专利]面向变压器检修场景的推理型自动问答方法、系统与计算机可读介质在审
申请号: | 202210531197.6 | 申请日: | 2022-05-16 |
公开(公告)号: | CN115048485A | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 付慧;孙弈骁;张国江;李双伟;杨景刚;胡成博;赵科;马径坦;贾骏;刘子全 | 申请(专利权)人: | 国网江苏省电力有限公司;国网江苏省电力有限公司电力科学研究院;国家电网有限公司;南京工业大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06N3/04;G06N3/08 |
代理公司: | 南京行高知识产权代理有限公司 32404 | 代理人: | 王培松;王菊花 |
地址: | 210000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 变压器 检修 场景 推理 自动 问答 方法 系统 计算机 可读 介质 | ||
1.一种面向变压器检修场景的推理型自动问答方法,其特征在于,包括以下步骤:
步骤1、接收用户输入的问题Q;
步骤2、结合预先构建的变压器检修场景标准库D,将问题Q在变压器检修场景标准库D中进行匹配,通过将问题Q与变压器检修场景标准库D进行embedding操作,获得问题Q与变压器检修场景标准库D的段落d的匹配概率;
步骤3、对匹配概率进行降序排序,取概率最大值对应的段落Dk输出;
步骤4、将问题Q与输出的段落Dk使用词向量工具进行处理获得词向量,以序列表示;
步骤5、基于数值抽取,识别问题Q的类型,包括纯文本类型问题以及数值类型问题,并依据识别的问题类型,通过不同的预测模型进行预测输出:
(1)对于纯文本类型问题,采用Bi-LSTM-Attention网络结构的第一模型对问题Q进行预测,输出问题答案,其中所述Bi-LSTM-Attention网络结构的第一模型以纯文本数据构成的数据集为训练数据,输入到由Bi-LSTM层的基础上加入Attention层构成的网络模型中进行训练而获得;
(2)对于数值类型问题,采用Bi-LSTM-Attention网络结构的第二模型对问题Q进行预测,输出问题答案,其中所述Bi-LSTM-Attention网络结构的第一模型以抽取的数值数据构成的数据集为训练数据,输入到由Bi-LSTM层的基础上加入Attention层构成的网络模型中进行训练而获得。
2.根据权利要求1所述的面向变压器检修场景的推理型自动问答方法,其特征在于,所述预先构建的变压器检修场景标准库D,其中包含多种变压器检修标准,将变压器检修场景标准库D按照自然段划分,获得多个段落d,每一个段落d均包含技术标准号、技术标准名称以及该条标准的相关描述。
3.根据权利要求1所述的面向变压器检修场景的推理型自动问答方法,其特征在于,在所述第一模型和第二模型的训练过程中,均使用Bi-LSTM层作为特征编码层,提取每个词向量的上下文特征,然后进行双向的特征拼接后,将每个词向量的特征进行输出;
在Attention层则基于权重矩阵对每个词向量进行加权求和,其中,权重矩阵初始化值为256*1维,然后通过点乘与归一化运算,得到代表每个词向量对应权重的权重矩阵,权重越大的词向量代表注意力越大并且词向量对应的贡献程度越大,最后对每个词语对应的词向量进行加权求和,输出最终加权平均后的总特征向量。
4.根据权利要求1所述的面向变压器检修场景的推理型自动问答方法,其特征在于,所述将问题Q与变压器检修场景标准库D进行embedding操作,包括在预先训练好的QDMatch匹配模型中进行计算输出,具体包括以下步骤:
将问题Q和变压器检修场景标准库D拆分的段落d进行拼接,并且在拼接的文本开头加上[CLS]标志位以及问题Q与段落的文本中间加上[SEP]标志位;其中:所述[CLS]标志位用于表示问题Q和段落d之间的相关概率;[SEP]标志位两个文本中间,作分割作用,分别对两个文本附加不同的文本向量作为区分;
确定问题Q和变压器检修场景标准库D拆分的段落d进行拼接的文本的Segment向量、Position向量以及Token向量,其中:所述Segment向量为区分句子的向量,问题Q的Segment向量元素为0,段落d的Segment向量元素为1;Position向量为句子的位置向量,其长度为整体句子的长度;Token向量为整体句子的词向量;
将Segment向量、Position向量以及Token向量三种向量输入到BERT模型中,经过BERT模型的双向12层Transformer Encoder结构,捕捉依赖关系,得到模型的输出,输出结果为问题Q和段落d的向量,取第1维[CLS]标志位的输出;
再使用全连接层的softmax函数得到问题Q与段落d的匹配概率,获得问题Q匹配的多个段落的文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江苏省电力有限公司;国网江苏省电力有限公司电力科学研究院;国家电网有限公司;南京工业大学,未经国网江苏省电力有限公司;国网江苏省电力有限公司电力科学研究院;国家电网有限公司;南京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210531197.6/1.html,转载请声明来源钻瓜专利网。