[发明专利]多媒体资源处理方法、装置、电子设备及存储介质在审
申请号: | 202210281719.1 | 申请日: | 2022-03-21 |
公开(公告)号: | CN114625897A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 康战辉 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/483 | 分类号: | G06F16/483;G06K9/62;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 贾允 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多媒体 资源 处理 方法 装置 电子设备 存储 介质 | ||
1.一种多媒体资源处理方法,其特征在于,所述方法包括:
获取待搜索的第一文本信息和多个多媒体资源;
分别对各多媒体资源中包括的第二文本信息和图像帧进行文本编码与图像编码,得到各多媒体资源的第二文本特征和图像特征;
对各多媒体资源的第二文本特征和图像特征进行跨模态特征融合处理,得到各多媒体资源对应的多模态特征;
对所述多模态特征和第一文本特征进行特征相关性处理,确定所述多个多媒体资源各自与所述第一文本信息的相关性信息,所述第一文本特征为所述第一文本信息对应的文本特征;所述相关性信息表征各多媒体资源的内容与所述第一文本信息的匹配度;
根据所述相关性信息,从所述多个多媒体资源中筛选出与所述第一文本信息匹配的目标多媒体资源。
2.根据权利要求1所述的方法,其特征在于,所述分别对各多媒体资源中包括的第二文本信息和图像帧进行文本编码与图像编码,得到各多媒体资源的第二文本特征和图像特征,包括:
从各多媒体资源中提取各多媒体资源对应的多个图像帧;
基于光学字符识别技术,从各多媒体资源对应的多个图像帧中提取各多媒体资源对应的第二文本信息;
将所述第二文本信息输入第二文本处理模型进行文本特征提取处理,得到各多媒体资源对应的第二文本特征;
将各多媒体资源对应的多个图像帧输入连接文本与图像的视觉特征预测模型进行图像特征提取处理,得到各多媒体资源对应的图像特征。
3.根据权利要求2所述的方法,其特征在于,所述对各多媒体资源的第二文本特征和图像特征进行跨模态特征融合处理,得到各多媒体资源对应的多模态特征,包括:
将所述第二文本特征和所述图像特征输入多模态特征融合模型,进行跨模态特征融合处理,得到各多媒体资源对应的所述多模态特征。
4.根据权利要求2或3所述的方法,其特征在于,所述基于光学字符识别技术,从各多媒体资源对应的多个图像帧中提取各多媒体资源对应的第二文本信息,包括:
对各图像帧进行区域划分处理,得到各图像帧各自对应的多个区域图像;
基于光学字符识别技术对所述多个区域图像进行文本提取处理,得到所述多个区域图像各自的区域文本;
对同类区域中的区域文本进行拼接和预处理,得到各类区域对应的第三文本信息;所述同类区域是指处于多个图像帧中相同位置的区域;
对各类区域对应的第三文本信息进行拼接处理,得到各多媒体资源对应的所述第二文本信息。
5.根据权利要求1-3任一所述的方法,其特征在于,所述对所述多模态特征和第一文本特征进行特征相关性处理,确定所述多个多媒体资源各自与所述第一文本信息的相关性信息,包括:
将所述第一文本特征、第一多模态特征以及第二多模态特征输入相关性预测模型,进行第一文本特征与多模态特征的相关性处理,得到所述相关性信息;
其中,所述第一多模态特征为第一多媒体资源对应的多模态特征,所述第二多模态特征为第二多媒体资源对应的多模态特征;所述第一多媒体资源和所述第二多媒体资源为所述多个多媒体资源中的任两个多媒体资源。
6.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取待修正的多媒体资源,所述待修正的多媒体资源为所述多个多媒体资源中除所述目标多媒体资源之外的多媒体资源;
基于所述待修正的多媒体资源各自对应的第二文本信息,确定所述待修正的多媒体资源各自的目标文本描述信息;
根据所述目标文本描述信息,修正所述待修正的多媒体资源各自的文本描述信息。
7.根据权利要求1所述的方法,其特征在于,所述获取所述多个多媒体资源,包括:
获取多个待匹配多媒体资源各自的文本描述信息;
基于所述文本描述信息,从所述多个待匹配多媒体资源中确定与所述第一文本信息对应的所述多个多媒体资源。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述第一文本信息输入第一文本处理模型进行文本特征提取处理,得到第一文本特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210281719.1/1.html,转载请声明来源钻瓜专利网。