[发明专利]多媒体处理系统及音频信号处理方法无效
申请号: | 201210346471.9 | 申请日: | 2012-09-18 |
公开(公告)号: | CN103686136A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 柯杰斌 | 申请(专利权)人: | 宏碁股份有限公司 |
主分类号: | H04N13/04 | 分类号: | H04N13/04;H04N13/00;H04N5/60;H04S7/00 |
代理公司: | 隆天国际知识产权代理有限公司 72003 | 代理人: | 张艳杰;张浴月 |
地址: | 中国台*** | 国省代码: | 中国台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多媒体 处理 系统 音频 信号 方法 | ||
技术领域
本发明涉及音频处理,尤其涉及使用立体图像的深度图像以处理音频信号的多媒体处理系统及音频处理方法。
背景技术
随着立体显示器的发展,立体图像的处理亦愈来愈重要。一般而言,立体图像的取得可通过几种方式,例如利用可得到深度图像的深度摄影机进行拍摄、由模拟人类双眼视觉的双摄影机进行拍摄、或是由二维图像经过适当的图像处理以得到立体图像。如图1A所示,由二维图像转换至立体图像的处理过程可约略分为几个步骤:图像缩小、边缘检测(edge detection)、线划追踪(line tracing)、深度指派(depth assignment)、深度图像放大及平滑化、横向偏移(lateral shifting),当深度图像建立之后,即可与原本的二维图像结合以产生立体图像(stereoscopic image)。传统二维图像转换为立体图像的演算法亦可通过建立空间模型、边缘检测、计算消失点等方式,通过对一张或多张图像的分析来建立深度图像。
如图1B所示,视觉深度感知因素可分为生理因素及心理因素。一般而言,二维图像转换为立体图像的深度图往往是针对几项心理因素以进行演算法的运算。举例来说,在心理因素上往往会认为黄色物体、移动量大的物体或大物体的景深最浅,反过来说,在心理因素上亦会认为蓝色物体、移动量小的物体或小物体的景深最深,而且材质接近会视为景深相同。
更进一步,景深信息为立体显示技术中的关键,但传统立体显示技术往往只着重于如何产生正确景深的产生方式,但却鲜少利用景深信息以进一步处理立体图像及对应的音频信号。
发明内容
为了克服现有技术的缺陷,本发明提供一种多媒体处理系统,包括:一深度分析器,用以接收一输入图像,并据以产生一深度图像;以及一音频处理单元,用以接收一输入音频信号及该深度图像,由该深度图像中检测一声音对象及其对应的一位置信息,其中该声音对象具有对应的一声音频率范围,其中当该位置信息超过一预定范围,该音频处理单元依据该位置信息对该输入音频信号中的该声音频率范围进行调整以产生一输出音频信号。
本发明还提供一种音频信号处理方法,用于一多媒体处理系统,包括:接收一输入图像,并据以产生一深度图像;接收一输入音频信号及该深度图像,并由该深度图像中检测一声音对象及其对应的一位置信息,其中该声音对象具有对应的一声音频率范围;以及当该位置信息超过一预定范围,依据该位置信息对该输入音频信号中的该声音频率范围进行调整以产生一输出音频信号。
附图说明
图1A是显示将二维图像转换为立体图像的传统演算法的流程图。
图1B是显示视觉深度感知因素的示意图。
图2是显示依据本发明一实施例的多媒体处理系统200的方框图。
图3A~图3D是显示依据本发明一实施例中音频处理单元辨识主对象以调整声道比例的示意图。
图4A~图4F是显示依据本发明另一实施例中音频处理单元230辨识主对象以调整声道比例的示意图。
图5是显示依据本发明一实施例中音频处理单元所使用的特定声音频率的示意图。
图6是显示依据本发明一实施例的音频处理单元进行声音频率调整的一示意表格。
图7是显示依据本发明一实施例的音频信号处理方法的流程图。
图8是显示依据本发明一实施例中音频处理单元所检测的多国语言的频率范围的示意图。
其中,附图标记说明如下:
200~多媒体处理系统;
210~深度分析器;
220~视频处理单元;
230~音频处理单元;
310~主对象;
410、420~对象。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宏碁股份有限公司,未经宏碁股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210346471.9/2.html,转载请声明来源钻瓜专利网。