[发明专利]一种问句自动生成方法及系统在审
| 申请号: | 202011040840.2 | 申请日: | 2020-09-28 |
| 公开(公告)号: | CN112115250A | 公开(公告)日: | 2020-12-22 |
| 发明(设计)人: | 周兴发;方凡;饶璐;谭斌;杨兰;孙锐;展华益 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/30;G06F40/289;G06N3/04 |
| 代理公司: | 四川省成都市天策商标专利事务所 51213 | 代理人: | 张秀敏 |
| 地址: | 621000 四*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 问句 自动 生成 方法 系统 | ||
1.一种问句自动生成方法,其特征在于,包括:
步骤S100:对原始数据进行语义向量初始化,得到数据语义初始化向量序列;
步骤S200:根据所述数据语义初始化向量序列确定待提问目标的位置;
步骤S300:对所述数据语义初始化向量序列和待提问目标的位置进行语义编码,得到数据语义编码加强后的向量序列;
步骤S400:根据所述数据语义编码加强后的向量序列,确定问句类型;
步骤S500:根据所述数据语义编码加强后的向量序列和问句类型,生成与待提问目标和问句类型相符合的问句。
2.根据权利要求1所述的一种问句自动生成方法,其特征在于,所述步骤S100具体包括:
步骤S110:对原始数据进行语义单元分割,将原始数据转换为语义单元序列数据;
步骤S120:对语义单元序列数据进行语义向量初始化,得到语义单元初始化向量;
步骤S130:使用语义向量融合方法对所述语义单元初始化向量进行融合,得到数据语义初始化向量序列。
3.根据权利要求1或2所述的一种问句自动生成方法,其特征在于,所述步骤S200具体包括:
步骤S210:将所述数据语义初始化向量序列作为输入,带入第一语义编码网络中进行信息的前向传播,得到数据语义编码向量序列;
步骤S220:对所述数据语义编码向量序列进行序列标注,得到待提问目标的位置。
4.根据权利要求3所述的一种问句自动生成方法,其特征在于,所述步骤S300具体包括:
步骤S310:根据待提问目标的位置提取待提问目标的语义编码序列;
步骤S320:将待提问目标的语义编码序列代入池化网络得到待提问目标的编码向量信息,数据语义编码向量序列的每个序列单元分别与待提问目标的语义编码序列进行编码对齐,得到对齐权重;
步骤S330:对待提问目标的语义编码序列加权求和,然后与待提问目标的编码向量信息一起串接到数据语义初始化向量序列对应的语义编码上,得到加强后的数据语义向量序列。
5.根据权利要求1所述的一种问句自动生成方法,其特征在于,所述步骤S400具体为:将数据语义编码加强后的向量序列和待提问目标的编码向量信息输入问句类型判断网络,根据问句类型判断网络输出的问句类型概率分布,得到与待提问目标相符合的问句类型。
6.根据权利要求1所述的一种问句自动生成方法,其特征在于,所述步骤S500具体包括:
步骤S510:初始化待提问目标的问句类型,得到问句类型编码向量;
步骤S520:使用第二语义编码网络对数据语义编码加强后的向量序列进行语义编码,得到数据的语义向量;
步骤S530:使用数据的语义向量作为解码网络的初始状态输入,问句类型编码向量和起始符SOS的初始化向量作为解码网络的初始输入向量,然后经解码网络迭代生成与待提问目标和问句类型相符合的问句。
7.一种问句自动生成系统,其特征在于,包括:
数据初始化模块,被配置成对原始数据进行语义单元分割得到语义单元序列数据,再对语义单元序列数据进行语义向量初始化得到语义单元初始化向量,融合语义单元初始化向量得到数据语义初始化向量序列;
位置确定模块,被配置成将数据语义初始化向量序列输入第一语义编码网络得到数据语义编码向量序列,再对所述数据语义编码向量序列进行序列标注,得到待提问目标的集合及待提问目标的位置;
编码获取模块,被配置成根据待提问目标的位置提取出待提问目标的语义编码序列信息,采用编码对齐网络,使数据语义编码向量序列与待提问目标的语义编码序列进行对齐;对待提问目标的语义编码序列加权求和,然后与待提问目标的编码向量信息一起串接到数据语义初始化向量序列对应的语义编码上;
问句类型选择模块,被配置成将数据语义编码加强后的向量序列输入问句类型判断网络,得到与待提问目标相符合的问句类型概率分布P,使用定义的问句类型选择函数选择与待提问目标相符合的最终问句类型;
问句生成模块,被配置成初始化待提问目标的问句类型得到问句类型编码向量;使用第二语义编码网络对数据语义编码加强后的向量序列进行语义编码,得到数据的语义向;使用数据的语义向量作为解码网络的初始状态输入,问句类型编码向量和起始符SOS的初始化向量作为解码网络的初始输入向量,然后经解码网络迭代生成与待提问目标和问句类型相符合的问句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011040840.2/1.html,转载请声明来源钻瓜专利网。





