[发明专利]基于语句融合的文本摘要生成方法、系统、终端及介质有效
| 申请号: | 202011430762.7 | 申请日: | 2020-12-07 |
| 公开(公告)号: | CN112464658B | 公开(公告)日: | 2022-08-09 |
| 发明(设计)人: | 金耀辉;何浩;肖力强;陈文清;田济东 | 申请(专利权)人: | 上海交通大学 |
| 主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/211;G06N3/04;G06N3/08 |
| 代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 张宁展 |
| 地址: | 200240 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 语句 融合 文本 摘要 生成 方法 系统 终端 介质 | ||
1.一种基于语句融合的文本摘要生成方法,其特征在于,包括:
对输入文本进行分句和分词,并记录每个词语所在句子的索引;
对分句和分词的结果先后进行词语和句子的表征,获得句子向量,并在句子向量的末尾添加分割符和结束符;
提取重要的句子,并根据分割符进行组别划分,形成多个句子组;
对每个句子组进行融合修饰,获得文本摘要;
对提取重要的句子和对每个句子组进行融合修饰的过程中所采用的神经网络进行交替训练,完成两个神经网络参数的梯度更新;
所述对分句和分词的结果先后进行词语和句子的表征,获得句子向量,并在句子向量的末尾添加分割符和结束符,包括:
使用预训练语言模型,获得每个词的表征向量,对获得的词的表征向量使用池化操作,获得句子的表征向量;
在得到的句子的表征向量的末尾,添加分割符向量以及结束符向量;
所述分割符向量以及结束符向量维度与句子向量相同,采用随机初始化;
所述提取重要的句子,并根据分割符进行组别划分,包括:
使用基于长短时记忆神经网络的指针网络提取重要的句子;
所述指针网络使用注意力机制,并结合顺序选择对应句子、分割符或结束符;
其中,对于多个句子组之间采用分割符,当结束时输出结束符;
所述对每个句子组进行融合修饰,获得文本摘要,包括:
使用基于长短时记忆神经网络的指针生成网络;
采用指针生成网络中的编码器先对每一个句子组进行编码获得句子组的表征向量;
采用指针生成网络中的解码器对句子组的表征向量进行解码,并在解码过程中通过注意力机制拷贝原文词语。
2.根据权利要求1所述的基于语句融合的文本摘要生成方法,其特征在于,所述对提取重要的句子和对每个句子组进行融合修饰分别采用了基于长短时记忆神经网络的指针网络和指针生成网络;使用合作强化学习对上述过程中采用的指针网络和指针生成网络进行交替训练,完成两个神经网络参数的梯度更新,包括:
合作强化学习交替训练指针网络和指针生成网络;
指针网络和指针生成网络共享回报函数;
通过策略梯度下降算法完成指针网络和指针生成网络参数的梯度更新。
3.根据权利要求2所述的基于语句融合的文本摘要生成方法,其特征在于,对于指针网络,每一个抽取行为的参数的梯度函数如下所示:
其中,π表示网络策略,ct为状态向量,用于表征当前抽取网络状态,at表示行为,即抽取句子、分割符或结束符,Rt为回报函数,用于量化抽取网络的行为对于任务的贡献,bt为任意基准函数;
对于指针生成网络,每一个生成行为的参数的梯度函数如下所示:
其中,π表示网络策略,ct表示指针生成网络的当前状态向量,at表示行为,即生成摘要词汇,是采样解码获得的动作,Rt(at)为采样解码获得的回报函数,用于表征融合网络对于人物的贡献,bt为任意基准函数。
4.根据权利要求2所述的基于语句融合的文本摘要生成方法,其特征在于,所述指针网络和指针生成网络共享回报函数,所述回报函数Rt(at)如下所示:
Rt(y′t)=SIM(y′t,yt)
其中,y′t为融合网络第t个句子组采样解码获得的摘要句子,yt为标准人类产生的摘要句子中的第t个句子,SIM是评测相似度的任意函数。
5.根据权利要求2所述的基于语句融合的文本摘要生成方法,其特征在于,所述交替训练指针网络和指针生成网络的训练过程,包括:
对于每一个样本,先前向运行网络,获得输出概率、回报和基准;然后对指针网络和指针生成网络分别进行参数更新,循环迭代,直到收敛。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011430762.7/1.html,转载请声明来源钻瓜专利网。





