[发明专利]一种自由化文本生成方法在审
申请号: | 201611036777.9 | 申请日: | 2016-11-23 |
公开(公告)号: | CN106776540A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 王琪鑫;王东;游世学;骆天一;邢超;杜新凯 | 申请(专利权)人: | 清华大学;北京中科汇联科技股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06N3/04 |
代理公司: | 北京庆峰财智知识产权代理事务所(普通合伙)11417 | 代理人: | 李文军 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自由化 文本 生成 方法 | ||
1.一种自由化文本生成方法,其特征在于,包括以下步骤:
S1、将用户输入的关键词组合成字符串;
S2、第一循环神经网络将所述字符串编码成一组维度为i的词向量,并根据词向量生成隐向量;
S3、第二循环神经网络根据所述词向量和隐向量生成第t个字的候选集,并预测第t个字的候选集的概率分布向量,其中t≥1;
S4、按照文本格式要求将候选集中概率分布最大维的字作为预测字Yt进行输出,通过循环迭代生成全部文本。
2.根据权利要求1所述的自由化文本生成方法,其特征在于,所述步骤S2中一组词向量包含n个词向量,一个词向量对应一个隐向量,其中,n为大于等于1的整数。
3.根据权利要求2所述的自由化文本生成方法,其特征在于,所述步骤S2中根据词向量生成隐向量,包括以下步骤:
S21、定义一个维度为j的初始隐向量h0和一个函数;
S22、根据函数公式进行循环迭代生成n个隐向量,所述函数公式为:
,
其中,为n个词向量中第k个词向量对应的隐向量,为n个词向量中第k个词向量,A为j*i的矩阵,B为j*j的矩阵,1≤k≤n。
4.根据权利要求3所述的自由化文本生成方法,其特征在于,所述步骤S3中第二循环神经网络根据词向量和隐向量生成第t个字的候选集之前还包括第二循环神经网络生成第t-1个字的隐层向量。
5.根据权利要求4所述的自由化文本生成方法,其特征在于,所述步骤S3中预测第t个字的候选集的概率分布,包括以下步骤:
S31、根据第二循环神经网络的第t-1个字的隐层向量St-1和第一循环神经网络生成的n个隐向量计算得到向量Ct,所述向量Ct为用于表示用户意图的向量;
S32、在第二循环神经网络中分别输入Ct、St-1和Yt-1;
S33、将Ct、St-1和Yt-1分别与权重矩阵D相乘得到St,函数式为:
S34、将St与矩阵E相乘得到第t个字的概率分布向量,函数式为:
。
6.根据权利要求5所述的自由化文本生成方法,其特征在于,所述步骤S31具体包括:
S311、利用第t-1个字的隐层向量St-1和第一循环神经网络生成的n个隐向量分别进行计算,得到n个权重系数,函数公式为:
其中,、和为大小不同的神经网络权值矩阵,若隐层向量的维度为p,则的大小为m*1,m*p,的大小为m*p,为的转置矩阵,为权重系数;
S312、将每个隐向量与相应的权重系数相乘,再求和得到向量Ct,函数公式为:
其中,为输入的信息的长度。
7.根据权利要求1-6任意一项所述的自由化文本生成方法,其特征在于,所述步骤S4中的文本格式要求包括强制加入的断句符号、符合平仄和押韵的规则。
8.根据权利要求7所述的自由化文本生成方法,其特征在于,所述第一循环神经网络为双向循环神经网络,所述第二循环神经网络为单向循环神经网络。
9.根据权利要求8所述的自由化文本生成方法,其特征在于,所述步骤S1中的关键词具有若干个,其中,一个关键词对应一个词向量;
所述步骤S4中,当将预测字Yt输出后进行迭代生成下一个字的预测字Yt之前,还包括计算当前的预测字Yt是由若干个所述关键词中的哪个关键词生成的,以便进行修正,修正的步骤为重复执行步骤S2至S4。
10.根据权利要求8或9所述的自由化文本生成方法,其特征在于,所述步骤S1还包括对用户输入的关键词进行扩充和乱序,扩充是指加入更多的关键词,所述乱序是指将用户输入的关键词进行小概率的顺序打乱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;北京中科汇联科技股份有限公司,未经清华大学;北京中科汇联科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611036777.9/1.html,转载请声明来源钻瓜专利网。