[发明专利]一种人机交互训练问答生成算法有效
| 申请号: | 201910016929.6 | 申请日: | 2019-01-08 |
| 公开(公告)号: | CN109815323B | 公开(公告)日: | 2021-02-12 |
| 发明(设计)人: | 杨栋;徐培;叶茂;苏扬 | 申请(专利权)人: | 四川灵灵器机器人有限责任公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06N3/04;G06N3/08;G06F40/289;G06F40/30 |
| 代理公司: | 成都虹盛汇泉专利代理有限公司 51268 | 代理人: | 刘冬静 |
| 地址: | 610041 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 人机交互 训练 问答 生成 算法 | ||
1.一种人机交互训练问答生成方法,其特征在于,包括以下步骤:
S1、根据输入的问题和对应的答案候选句子,通过分词和量化处理,提取句子的关键词及所述关键词在句子中的权重向量,得到以问题类型为根节点、关键词为叶子结点、关键词之间的联系为隐节点的带权有向图模型,优化所述图模型;步骤S1包括以下流程:
S11、获取问题Q和对应的答案候选句子S,通过分词和量化处理,提取得到句子的关键词,以及所述关键词在句子中的权重向量,并得到关键词和句子之间的关系序列ANS={KS(i,j)},其中,KS(i,j)=(Ki,Sj),Ki表示提取的关键词集合中的第i个关键词,Sj表示与该关键词对应的第j个句子;
每个问题生成以问题类型为根节点、关键词为叶子结点、关键词之间的联系为隐节点的带权有向图模型,为Q=(T,K,R),其中,T表示问题类型,K表示对应关键词的节点,R表示关键词间关联关系的序列集,bi表示关键词Ki子树所占的权重,βi,k表示关键词Ki与句子Sk的关联程度;
S12、构造目标函数;
构造的两个目标函数为
其中,
G(Ri,j)=bi·GRi2+bj·GRj2
其中,bi、bj为待求参数,表示关键词子树的权重;βi,k为关键词Ki关联的句子Sk的权重向量;Mi为关键词Ki的关联句子的个数;f(sk)表示句子Sk中含有的关键词对应的特征向量;Z为归一化系数;E(*)表示取期望值;两个目标函数采用交替优化来实现;
S13、优化目标函数,确定所述图模型的边权重;
优化过程中,根据求导得到
根据maxScore(T)求得bi
先赋予b、β初始值,通过所述步骤S13更新b、β的值;
S14,判断迭代次数是否超过预设迭代次数阈值,若没超过所述预设迭代次数阈值,流程返回所述步骤S13继续进行迭代更新;若超过所述预设迭代次数阈值,得到优化后的图模型;
S2、根据优化后的图模型,得到规则序列,并对所述规则序列进行向量化;
S3、将向量化后的规则序列输入至长短期记忆网络(Long Short-Term Memory,LSTM)模型中进行训练,将训练得到的模型参数代入LSTM模型中,得到训练后的LSTM模型,输入问题至训练后的LSTM模型得到对应的答案句子。
2.如权利要求1所述的人机交互训练问答生成方法,其特征在于,所述步骤S3包括以下流程:
S31、将向量化后的规则序列输入至LSTM模型,进行训练;
S32、前向计算每个神经元的输出值,即ft、it、ct、ot、ht五个向量的值;ct表示单元状态,ot表示长期记忆对当前输出的影响,ht表示LSTM模型最终的输出;
S33、反向计算每个神经元的误差项δ值;
S34、根据相应的误差项,计算每个权重的梯度;
S35、判断损失函数值是否达到预设阈值,若没有达到,流程返回所述步骤S32;若达到,得到训练后的LSTM模型;
S36、输入问题至训练后的LSTM模型得到对应的答案句子,得到问答对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川灵灵器机器人有限责任公司,未经四川灵灵器机器人有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910016929.6/1.html,转载请声明来源钻瓜专利网。





