[发明专利]一种数据处理方法、设备以及计算机可读存储介质有效

申请号：	202210336414.6	申请日：	2022-04-01
公开（公告）号：	CN114419527B	公开（公告）日：	2022-06-14
发明（设计）人：	陈小帅	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G06V20/40	分类号：	G06V20/40;G06F16/176
代理公司：	广州三环专利商标代理有限公司 44202	代理人：	彭程
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种数据处理方法设备以及计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种数据处理方法，其特征在于，包括：

获取视频中的至少两个视频片段，确定所述至少两个视频片段分别对应的片段共享质量，根据至少两个片段共享质量，从所述至少两个视频片段中确定候选视频片段；

获取与所述视频相关联的对象标签文本序列，根据所述对象标签文本序列以及所述候选视频片段，确定所述候选视频片段对应的对象共享质量，根据所述候选视频片段对应的对象共享质量，从所述候选视频片段中确定候选共享视频片段；

根据所述对象标签文本序列以及所述候选共享视频片段，确定所述候选共享视频片段对应的辅助共享质量，根据所述候选共享视频片段对应的辅助共享质量，确定所述候选共享视频片段对应的辅助描述信息；

根据所述候选共享视频片段对应的片段共享质量、所述候选共享视频片段对应的对象共享质量，以及所述候选共享视频片段对应的辅助共享质量，从所述候选共享视频片段中确定共享视频片段，将所述共享视频片段以及所述共享视频片段对应的辅助描述信息，确定为用于发送至共享对象的共享数据。

2.根据权利要求1所述的方法，其特征在于，所述获取视频中的至少两个视频片段，确定所述至少两个视频片段分别对应的片段共享质量，包括：

获取视频，根据时间窗口对所述视频进行切分处理，得到所述视频对应的至少两个视频片段；所述至少两个视频片段包括视频片段A_b，b为正整数，且b小于或等于所述至少两个视频片段对应的总数量；

从所述视频片段A_b中获取K个视频帧，以及所述K个视频帧分别对应的音频帧；K为正整数；

对所述视频片段A_b进行音频识别处理，得到音频识别文本，提取所述视频片段A_b中的视频描述文本以及对象评论文本；

将所述音频识别文本、所述视频描述文本以及所述对象评论文本，确定为所述视频片段A_b对应的内容文本E_b；

根据所述K个视频帧、K个音频帧以及所述内容文本E_b，生成所述视频片段A_b对应的多媒体融合特征；

根据所述至少两个视频片段分别对应的多媒体融合特征，确定所述至少两个视频片段分别对应的片段共享质量。

3.根据权利要求2所述的方法，其特征在于，所述根据所述K个视频帧、K个音频帧以及所述内容文本E_b，生成所述视频片段A_b对应的多媒体融合特征，包括：

获取视频识别模型；所述视频识别模型包括第一视频识别子模型；所述第一视频识别子模型包括视频融合网络层、音频融合网络层、文本融合网络层以及多媒体融合网络层；

将所述K个视频帧分别输入至所述视频融合网络层，通过所述视频融合网络层，对所述K个视频帧分别进行特征提取，得到所述K个视频帧分别对应的待融合视频特征，对K个待融合视频特征进行特征融合，得到所述视频片段A_b对应的视频特征；

将所述K个音频帧分别输入至所述音频融合网络层，通过所述音频融合网络层，对所述K个音频帧分别进行特征提取，得到所述K个音频帧分别对应的待融合音频特征，对K个待融合音频特征进行特征融合，得到所述视频片段A_b对应的音频特征；

将所述内容文本E_b输入至所述文本融合网络层，通过所述文本融合网络层，提取所述内容文本E_b中的关键文本，对所述关键文本进行特征提取，得到所述关键文本对应的文本特征；

将所述视频特征、所述音频特征以及所述文本特征分别输入至所述多媒体融合网络层，通过所述多媒体融合网络层，对所述视频特征、所述音频特征以及所述文本特征进行特征融合，得到所述视频片段A_b对应的多媒体融合特征。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于腾讯科技（深圳）有限公司，未经腾讯科技（深圳）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210336414.6/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载