[发明专利]一种自由化文本生成方法在审

专利信息
申请号: 201611036777.9 申请日: 2016-11-23
公开(公告)号: CN106776540A 公开(公告)日: 2017-05-31
发明(设计)人: 王琪鑫;王东;游世学;骆天一;邢超;杜新凯 申请(专利权)人: 清华大学;北京中科汇联科技股份有限公司
主分类号: G06F17/27 分类号: G06F17/27;G06N3/04
代理公司: 北京庆峰财智知识产权代理事务所(普通合伙)11417 代理人: 李文军
地址: 10008*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 自由化 文本 生成 方法
【权利要求书】:

1.一种自由化文本生成方法,其特征在于,包括以下步骤:

S1、将用户输入的关键词组合成字符串;

S2、第一循环神经网络将所述字符串编码成一组维度为i的词向量,并根据词向量生成隐向量;

S3、第二循环神经网络根据所述词向量和隐向量生成第t个字的候选集,并预测第t个字的候选集的概率分布向量,其中t≥1;

S4、按照文本格式要求将候选集中概率分布最大维的字作为预测字Yt进行输出,通过循环迭代生成全部文本。

2.根据权利要求1所述的自由化文本生成方法,其特征在于,所述步骤S2中一组词向量包含n个词向量,一个词向量对应一个隐向量,其中,n为大于等于1的整数。

3.根据权利要求2所述的自由化文本生成方法,其特征在于,所述步骤S2中根据词向量生成隐向量,包括以下步骤:

S21、定义一个维度为j的初始隐向量h0和一个函数;

S22、根据函数公式进行循环迭代生成n个隐向量,所述函数公式为:

其中,为n个词向量中第k个词向量对应的隐向量,为n个词向量中第k个词向量,A为j*i的矩阵,B为j*j的矩阵,1≤k≤n。

4.根据权利要求3所述的自由化文本生成方法,其特征在于,所述步骤S3中第二循环神经网络根据词向量和隐向量生成第t个字的候选集之前还包括第二循环神经网络生成第t-1个字的隐层向量。

5.根据权利要求4所述的自由化文本生成方法,其特征在于,所述步骤S3中预测第t个字的候选集的概率分布,包括以下步骤:

S31、根据第二循环神经网络的第t-1个字的隐层向量St-1和第一循环神经网络生成的n个隐向量计算得到向量Ct,所述向量Ct为用于表示用户意图的向量;

S32、在第二循环神经网络中分别输入Ct、St-1和Yt-1

S33、将Ct、St-1和Yt-1分别与权重矩阵D相乘得到St,函数式为:

S34、将St与矩阵E相乘得到第t个字的概率分布向量,函数式为:

6.根据权利要求5所述的自由化文本生成方法,其特征在于,所述步骤S31具体包括:

S311、利用第t-1个字的隐层向量St-1和第一循环神经网络生成的n个隐向量分别进行计算,得到n个权重系数,函数公式为:

其中,、和为大小不同的神经网络权值矩阵,若隐层向量的维度为p,则的大小为m*1,m*p,的大小为m*p,为的转置矩阵,为权重系数;

S312、将每个隐向量与相应的权重系数相乘,再求和得到向量Ct,函数公式为:

其中,为输入的信息的长度。

7.根据权利要求1-6任意一项所述的自由化文本生成方法,其特征在于,所述步骤S4中的文本格式要求包括强制加入的断句符号、符合平仄和押韵的规则。

8.根据权利要求7所述的自由化文本生成方法,其特征在于,所述第一循环神经网络为双向循环神经网络,所述第二循环神经网络为单向循环神经网络。

9.根据权利要求8所述的自由化文本生成方法,其特征在于,所述步骤S1中的关键词具有若干个,其中,一个关键词对应一个词向量;

所述步骤S4中,当将预测字Yt输出后进行迭代生成下一个字的预测字Yt之前,还包括计算当前的预测字Yt是由若干个所述关键词中的哪个关键词生成的,以便进行修正,修正的步骤为重复执行步骤S2至S4。

10.根据权利要求8或9所述的自由化文本生成方法,其特征在于,所述步骤S1还包括对用户输入的关键词进行扩充和乱序,扩充是指加入更多的关键词,所述乱序是指将用户输入的关键词进行小概率的顺序打乱。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;北京中科汇联科技股份有限公司,未经清华大学;北京中科汇联科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611036777.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top