[发明专利]一种基于语义相关度模型的中文文本摘要获取方法有效
申请号: | 201710397540.1 | 申请日: | 2017-05-31 |
公开(公告)号: | CN107291836B | 公开(公告)日: | 2020-06-02 |
发明(设计)人: | 孙栩;马树铭;许晶晶 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F40/30 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 相关 模型 中文 文本 摘要 获取 方法 | ||
1.一种基于语义相关度模型的中文文本摘要获取方法,通过构建语义相关度模型,得到原文本的编码向量和摘要的解码向量之间的相关度,作为原文本和生成摘要之间相关性的度量;再通过训练语义相关度模型最大化所述相关度,由此生成完整的摘要;包括如下步骤:
A.设计文本编码器,所述文本编码器利用深度神经网络将原文本进行压缩,得到原文本的编码向量Vs;
B.设计摘要解码生成器,在第一个时刻输入原文本的编码向量Vs和起始句子开始的标识符,利用深度神经网络循环地在每一时刻输入上一个时刻预测得到的字或标识符,经过网络结构输出当前时刻预测的字,经过多次循环得到多个连续的字,即为一段完整的摘要;摘要解码生成器还同时生成上述完整摘要的解码向量Vt;
C.构建语义相关度模型,得到两个向量Vs与Vt之间的相关度,作为原文本和生成摘要之间相关性的度量;所述语义相关度模型为余弦相似函数,表示为式1:
其中,Vs为文本编码器生成的编码向量;Vt为摘要解码生成器生成的解码向量;符号‖·‖代表向量的二范数;通过式1所示余弦相似函数得到两个向量Vs与Vt之间的相关度,作为原文本和生成摘要之间相关性的度量;
D.训练语义相关度模型,即最大化步骤C得到的相关度;
E.经过多轮训练,当步骤C得到的相关度最大化时停止训练,此时摘要解码生成器即生成完整的摘要。
2.如权利要求1所述中文文本摘要获取方法,其特征是,步骤A具体使用深度神经网络中的循环神经网络,在开始时刻将原文本中的一个字输入到循环神经网络,将这个字压缩成一个向量,然后将压缩后得到的向量传入下一时刻;下一时刻将上一时刻的压缩向量和原文本的下一个字输入到循环神经网络,再将压缩得到的新向量传入下一时刻;在压缩完所有文本后得到的编码向量,即是文本编码器压缩后的信息。
3.如权利要求1所述中文文本摘要获取方法,其特征是,步骤B具体采用深度神经网络中的长短时记忆网络,在第一个时刻将一个开始的标识符输入长短时记忆网络,然后在接下来的每一时刻输入上一时刻预测的字,经过网络结构输出当前时刻预测的字,最后时刻输出结束的标识符,摘要解码生成器即生成一段完整的摘要。
4.如权利要求1所述中文文本摘要获取方法,其特征是,步骤D使用Adam优化算法训练语义相关度模型,最大化步骤C得到的相关度。
5.如权利要求4所述中文文本摘要获取方法,其特征是,在训练过程中,先随机选取训练数据中的多个样本,对样本按照所述语义相关度模型计算目标函数,目标函数表示为式2:
其中,为训练数据中的正确摘要;p(y|x;θ)为解码生成器预测出摘要的概率;λ为模型的权重系数;cos(Vs,Vt)为语义相关模型计算出的相关度值;
训练的目标是最大化模型的目标函数:先计算目标函数的梯度,再使用Adam优化算法依照梯度更新模型的参数;当模型的目标函数达到最大化时,即得到训练好的语义相关度模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710397540.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种搜索词的推荐方法和装置
- 下一篇:一种基于领域适应性的网络文本的分词方法