[发明专利]视频处理方法和装置、用于视频处理的装置有效
申请号: | 201710737846.7 | 申请日: | 2017-08-24 |
公开(公告)号: | CN109429077B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 张杰;卜海亮;靳一笑;邢真臻;蒋品;冯新强 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | H04N21/233 | 分类号: | H04N21/233;H04N21/234;H04N21/235;H04N21/435;H04N21/439;H04N21/44;G06K9/00;G06K9/32 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 处理 方法 装置 用于 | ||
本发明实施例提供了一种视频处理方法和装置、一种用于视频处理的装置,其中的方法具体包括:对视频对应的音频流进行语音识别,以得到对应的文本信息;从预置物品库中获取与所述文本信息相匹配的目标物品;将所述目标物品对应的目标信息添加在所述音频流对应的视频帧中。本发明实施例可以有效缩短视频的处理时间、以及有效提升视频处理效率,且可以有效提高目标信息的视频覆盖率。
技术领域
本发明涉及视频技术领域,特别是涉及一种视频处理方法和装置、一种用于视频处理的装置。
背景技术
随着互联网技术的发展,越来越多的用户习惯通过电脑、手机等终端观看视频,具体地,用户可以通过本地安装的客户端的播放器或者网页上植入的播放器观看感兴趣的视频。
目前,可以通过视频处理在视频中添加信息。现有方案可以通过人工操作在视频中添加信息,具体地,操作人员在观看视频后,首先从视频中抽取出适合添加信息的视频帧,然后获取该视频帧对应的信息,接着利用编辑系统在该视频帧中插入所获取的信息。
然而,现有方案通过人工操作在视频中添加信息,需要花费较多的时间成本和人力成本,这样将导致视频处理效率低下。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的视频处理方法、视频处理装置及用于视频处理的装置,本发明实施例可以有效缩短视频的处理时间、以及有效提升视频处理效率,且可以有效提高目标信息的视频覆盖率。
为了解决上述问题,本发明公开了一种视频处理方法,包括:
对视频对应的音频流进行语音识别,以得到对应的文本信息;
从预置物品库中获取与所述文本信息相匹配的目标物品;
将所述目标物品对应的目标信息添加在所述音频流对应的视频帧中。
另一方面,本发明公开了一种视频处理装置,包括:
语音识别模块,用于对视频对应的音频流进行语音识别,以得到对应的文本信息;
目标物品获取模块,用于从预置物品库中获取与所述文本信息相匹配的目标物品;以及
目标信息添加模块,用于将所述目标物品对应的目标信息添加在所述音频流对应的视频帧中。
可选地,所述目标物品获取模块包括:
判断子模块,用于判断所述文本信息是否包括与所述预置物品库中第一物品或者第一物品的同类物品对应的特征信息相匹配的信息,若是,则将所述第一物品作为与所述文本信息相匹配的目标物品。
可选地,所述目标信息添加模块包括:
视频帧选择子模块,用于从所述音频流对应的视频帧中选择适于添加所述目标信息的目标视频帧;
目标位置确定子模块,用于确定所述目标视频帧中用于添加目标信息的目标位置;
添加子模块,用于在所述目标视频帧中的所述目标位置添加所述目标信息。
可选地,所述视频帧选择子模块包括:
目标文本信息获取单元,用于获取所述文本信息中与所述目标物品的特征信息相匹配的信息作为目标文本信息;
目标音频提取单元,用于提取所述音频流中与所述目标文本信息对应的部分作为目标音频;
目标视频帧确定单元,用于将所述目标音频对应的视频帧作为所述目标视频帧。
可选地,所述目标位置确定子模块包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710737846.7/2.html,转载请声明来源钻瓜专利网。