[发明专利]摘要获取方法以及电子设备、存储装置有效

专利信息
申请号: 202110484890.8 申请日: 2021-04-30
公开(公告)号: CN113282742B 公开(公告)日: 2022-08-12
发明(设计)人: 贾国庆;张浩宇;王玉杰;吴飞;方四安;柳林;徐承 申请(专利权)人: 合肥讯飞数码科技有限公司
主分类号: G06F16/34 分类号: G06F16/34;G06F40/30;G06F16/35
代理公司: 深圳市威世博知识产权代理事务所(普通合伙) 44280 代理人: 何倚雯
地址: 230000 安徽省合肥市高新区*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 摘要 获取 方法 以及 电子设备 存储 装置
【说明书】:

本申请公开了一种摘要获取方法以及电子设备、存储装置,其中,摘要获取方法包括:获取文档组;其中,文档组包含若干文档,每一文档包含若干候选分句;分别提取若干文档中若干候选分句的句子语义表示;其中,句子语义表示包含候选分句在文档组内的第一位置信息;基于句子语义表示,选择至少一个候选分句作为目标分句;利用目标分句,得到文档组的目标摘要。上述方案,能够降低摘要冗余度,并提高摘要可读性。

技术领域

本申请涉及自然语言处理技术领域,特别是涉及一种摘要获取方法以及电子设备、存储装置。

背景技术

随着信息技术的发展,每天都会产生海量的文本信息,信息总量正呈指数级别增长。因此,有必要提取文本信息的摘要,以便快速预览文本信息,辅助用户选择感兴趣的文本信息进行着重阅读。

目前,通常直接将多个文档拼接在一起来提取摘要,导致摘要冗余度高且可读性差,极易用户阅读体验。有鉴于此,如何降低摘要冗余度,并提高摘要可读性成为极具研究价值的课题。

发明内容

本申请主要解决的技术问题文本是提供一种摘要获取方法以及电子设备、存储装置,能够降低摘要冗余度,并提高摘要可读性。

为了解决上述问题文本,本申请第一方面提供了一种摘要获取方法,包括:获取文档组;其中,文档组包含若干文档,每一文档包含若干候选分句;分别提取若干文档中若干候选分句的句子语义表示;其中,句子语义表示包含候选分句在文档组内的第一位置信息;基于句子语义表示,选择至少一个候选分句作为目标分句;利用目标分句,得到文档组的目标摘要。

为了解决上述问题文本,本申请第二方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的摘要获取方法。

为了解决上述问题文本,本申请第三方面提供了一种存储装置,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的摘要获取方法。

上述方案,获取文档组,且文档组包含若干文档,每一文档包含若干候选分句,基于此再分别提取若干文档中若干候选分句的句子语义表示去,且句子语义表示包含候选分句在文档组内的第一位置信息,并基于句子语义表示,选择至少一个候选分句作为目标分句,以及利用目标分句,得到文档组的目标摘要,由于句子语义表示包含候选分句在文档组内的第一位置信息,故能够在选择目标分句时捕获候选分句之间的层次关系,避免直接拼接而无法获取关键的层次信息,一方面能够排除无关候选分句对于摘要获取的干扰,降低冗余度,另一方面也有利于通过选择出来的目标分句得到符合文档关系的目标摘要,提高可读性。故此,本方案能够降低摘要冗余度,并提高摘要可读性。

附图说明

图1是本申请摘要获取方法一实施例的流程示意图;

图2是图1中步骤S14一实施例的流程示意图;

图3是训练摘要模型一实施例的过程示意图;

图4是本申请电子设备一实施例的框架示意图;

图5是本申请存储装置一实施例的框架示意图。

具体实施方式

下面结合说明书附图,对本申请实施例的方案进行详细说明。

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。

本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。

请参阅图1,图1是本申请文档获取方法一实施例的流程示意图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥讯飞数码科技有限公司,未经合肥讯飞数码科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110484890.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top