[发明专利]关键信息提取和直播内容处理方法、装置及设备在审
申请号: | 202111556311.2 | 申请日: | 2021-12-17 |
公开(公告)号: | CN114239567A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 汪权彬 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/216;H04N21/2187;H04N21/439;G10L15/26 |
代理公司: | 北京君慧知识产权代理事务所(普通合伙) 11716 | 代理人: | 吴绍群 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键 信息 提取 直播 内容 处理 方法 装置 设备 | ||
本说明书实施例公开了关键信息提取和直播内容处理方法、装置及设备。方案包括:获取待提取关键信息的原始文本;确定针对原始文本的注意力权重向量,并根据注意力权重向量,对应地生成第一目标词;判断第一目标词是否包括在原始文本中;若是,则根据注意力权重向量,获取在生成第一目标词时所述第一目标词的注意力权重,根据第一目标词的注意力权重,生成针对第一目标词的惩罚数据,以根据惩罚数据,继续生成第二目标词,其中,惩罚数据用于降低继续生成的第二目标词与第一目标词相同的可能性;根据第一目标词和第二目标词,生成关键信息。
技术领域
本说明书涉及机器学习技术领域,尤其涉及关键信息提取和直播内容处理方法、装置及设备。
背景技术
随着互联网技术的发展,人们生活中面临的信息量呈爆炸式增长。
目前,为了便于快速浏览信息,信息提供方通常会对提供的信息内容进行关键信息提取,以标题、简介等少量关键信息的形式,对数据量较大的信息内容进行总结概括,以便于用户能够对各种信息进行快速了解,节省浏览时间。为了节省人力,对于一些信息内容可以通过语义分析自动提取关键信息,然而在实际应用中,提取出的关键信息中往往出现冗余信息,影响用户体验。
基于此,需要更加准确的关键信息提取方案。
发明内容
本说明书一个或多个实施例提供关键信息提取和直播内容处理方法、装置、设备及存储介质,用以解决如下技术问题:目前提取出的关键信息中往往出现冗余信息,影响用户体验,需要更加准确的关键信息提取方案。
为解决上述技术问题,本说明书一个或多个实施例是这样实现的:
本说明书一个或多个实施例提供的一种关键信息提取方法,包括:
获取待提取关键信息的原始文本;
确定针对所述原始文本的注意力权重向量,并根据所述注意力权重向量,对应地生成第一目标词;
判断所述第一目标词是否包括在所述原始文本中;
若是,则根据所述注意力权重向量,获取在生成所述第一目标词时所述第一目标词的注意力权重,根据所述第一目标词的注意力权重,生成针对所述第一目标词的惩罚数据,以根据所述惩罚数据,继续生成第二目标词,其中,所述惩罚数据用于降低继续生成的所述第二目标词与所述第一目标词相同的可能性;
根据所述第一目标词和所述第二目标词,生成所述关键信息。
本说明书一个或多个实施例提供的一种基于覆盖机制的直播内容处理方法,包括:
获取直播平台上的主播的直播视频;
对所述直播视频进行语音识别和切片处理,得到多个直播片段文本;
确定针对所述直播片段文本的注意力权重向量,并根据所述注意力权重向量,对应地生成第一目标词;
判断所述第一目标词是否包括在所述直播片段文本中;
若是,则生成针对所述第一目标词的惩罚数据,以根据所述惩罚数据,继续生成第二目标词,其中,所述惩罚数据用于降低继续生成的所述第二目标词与所述第一目标词相同的可能性;
根据所述第一目标词和所述第二目标词,生成所述直播片段文本的关键信息,作为所述直播片段文本对应的直播视频片段的片段标题;
将各所述直播视频片段以及为其生成的所述片段标题结合后发布,以便用户选段回放。
本说明书一个或多个实施例提供的一种关键信息提取装置,包括:
第一获取模块,获取待提取关键信息的原始文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111556311.2/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置