[发明专利]视频对象语音播放方法、装置、电子设备及可读存储介质在审
申请号: | 202211540203.0 | 申请日: | 2022-12-02 |
公开(公告)号: | CN116017033A | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 赵冠博 | 申请(专利权)人: | 歌尔科技有限公司 |
主分类号: | H04N21/439 | 分类号: | H04N21/439;H04N21/44 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 高莎 |
地址: | 266104 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 对象 语音 播放 方法 装置 电子设备 可读 存储 介质 | ||
本申请公开了视频对象语音播放方法、装置、电子设备及可读存储介质,应用于语音处理技术领域,所述视频对象语音播放方法包括:确定音视频画面中的目标视频对象和语音收听者之间的空间位置信息;根据所述空间位置信息和所述目标视频对象在所述音视频画面中的音源画面位置信息,确定所述目标视频对象对应的初始语音的音源空间位置信息;根据所述音源空间位置信息,对所述初始语音进行空间渲染,得到空间渲染语音;向所述语音收听者播放所述空间渲染语音。本申请解决了音视频场景下的语音播放效果差的技术问题。
技术领域
本申请涉及语音处理技术领域,尤其涉及一种视频对象语音播放方法、装置、电子设备及可读存储介质。
背景技术
随着科技的不断发展,音视频设备得以应用于用户生活的方方面面,例如在视频播放、视频浏览、网课学习以及视频通话等众多音视频场景中,用户都可在观看音视频设备显示视频画面的同时,通过音视频设备自带的扬声器、蓝牙耳机、有线耳机以及AR(Augmented Reality,增强现实)设备的扬声器等又可实时播放视频画面的视频语音,但是,由于视频语音的语音产生方位受限于语音输出设备的扬声器位置,使得用户无法准确感知视频画面中视频对象的真实语音位置,进而导致用户无法拥有现实场景中的视听体验,也即,用户在音视频场景下的沉浸感和真实感差,所以,当前音视频场景下的语音播放效果差。
发明内容
本申请的主要目的在于提供一种视频对象语音播放方法、装置、电子设备及可读存储介质,旨在解决现有技术中音视频场景下的语音播放效果差的技术问题。
为实现上述目的,本申请提供一种视频对象语音播放方法,所述视频对象语音播放方法包括:
确定音视频画面中的目标视频对象和语音收听者之间的空间位置信息;
根据所述空间位置信息和所述目标视频对象在所述音视频画面中的音源画面位置信息,确定所述目标视频对象对应的初始语音的音源空间位置信息;
根据所述音源空间位置信息,对所述初始语音进行空间渲染,得到空间渲染语音;
向所述语音收听者播放所述空间渲染语音。
为实现上述目的,本申请还提供一种视频对象语音播放装置,所述视频对象语音播放装置包括:
第一确定模块,用于确定音视频画面中的目标视频对象和语音收听者之间的空间位置信息;
第二确定模块,用于根据所述空间位置信息和所述目标视频对象在所述音视频画面中的音源画面位置信息,确定所述目标视频对象对应的初始语音的音源空间位置信息;
渲染模块,用于根据所述音源空间位置信息,对所述初始语音进行空间渲染,得到空间渲染语音;
播放模块,用于向所述语音收听者播放所述空间渲染语音。
本申请还提供一种电子设备,所述电子设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述视频对象语音播放方法的程序,所述视频对象语音播放方法的程序被处理器执行时可实现如上述的视频对象语音播放方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有实现视频对象语音播放方法的程序,所述视频对象语音播放方法的程序被处理器执行时实现如上述的视频对象语音播放方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的视频对象语音播放方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于歌尔科技有限公司,未经歌尔科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211540203.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种砂卵砾石地层地下连续墙用成槽护壁泥浆
- 下一篇:镀锡在线重熔工艺