[发明专利]一种携带位置信息的语音编码方法在审

专利信息
申请号: 201610148864.7 申请日: 2016-03-16
公开(公告)号: CN105761721A 公开(公告)日: 2016-07-13
发明(设计)人: 邓星球;胡中骥 申请(专利权)人: 广东佳禾声学科技有限公司
主分类号: G10L19/00 分类号: G10L19/00;H04L12/58
代理公司: 东莞市华南专利商标事务所有限公司 44215 代理人: 梁年顺
地址: 523808 广东省东莞市松*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 携带 位置 信息 语音 编码 方法
【说明书】:

技术领域

发明涉及语言编码技术,尤其是指一种携带位置信息的语音编码方法。

背景技术

目前声音数据格式中一般仅含音频信息,并没有单独将发声源方位信息进行编码。能够让人有方位感的音频格式为5.1或7.1音轨的音频文件。然而5.1或7.1的音频文件,需要支持多声道的声卡及多个音箱方能让人感受到声音的方位。目前虚拟5.1、虚拟7.1处理,都是需要原声音数数含5.1音源或7.1音源,否则无法重现声音的环绕效果。

发明内容

本发明针对现有技术的问题提供一种携带位置信息的语音编码方法,在音频格式中携带有声源方位信息,实现在语音信息中携带位置信息。

为了解决上述技术问题,本发明采用如下技术方案:

一种携带位置信息的语音编码方法,包括:

(1)、信号获取步骤:通过受话器采集语音信号,通过传感器或人工输入方式形成位置信息;

(2)、转码步骤:通过A/D转换器将语音信号由语音模拟信号转换为语音数字信号,通过位置编码器将位置信息转化为固定长度的二进制位置信息;

(3)、重新编码步骤:通过语音合成器将二进制位置信息和语音数字信号进行重新生成新的音频数据。

其中,进行编码步骤前,所述二进制位置信息缓存于缓存器BUF内,且语音数字信号进行码速调整。

本发明的有益效果:

本发明依次通过信号获取、转码以及重新编码等步骤将位置信息与语音进行统一编码,实现了在语音信息中携带位置信息。可灵活根据声卡特征进行环绕音音频恢复,无论是立体声声卡、5.1声卡还是7.1声卡都将能获取相应携带位置信息的音频数据。

具体实施方式

为了便于本领域技术人员的理解,下面结合实施例对本发明作进一步的说明,实施方式提及的内容并非对本发明的限定。以下对本发明进行详细的描述。

在日常生活中某些情况下,例如电影或游戏的音频中,往往需要将一些声音播放出来,使得人感觉是在某个方向发出来的。如:某电影中需要从右前方45度方向、距离3m处,发出狗叫声,那么我们可以将采集到的狗叫声,再加上此位置信息(右前方45度,3m远),进行统一编码。本发明所提供的一种携带位置信息的语音编码方法,具体包括以下步骤:

(1)、信号获取步骤:通过受话器采集语音信号,通过传感器或人工输入方式形成位置信息;(2)、转码步骤:通过A/D转换器将语音信号由语音模拟信号转换为语音数字信号,通过位置编码器将位置信息转化为固定长度的二进制位置信息;(3)、编码步骤:通过语音合成器将二进制位置信息和语音数字信号进行重新生成新的音频数据。本发明通过上述信号获取、转码以及重新编码等步骤将位置信息与语音进行统一编码,实现了在语音信息中携带位置信息。可灵活根据声卡特征进行环绕音音频恢复,无论是立体声声卡、5.1声卡还是7.1声卡都将能获取相应携带位置信息的音频数据。

在语音的编码格式中,含有位置信息字段的含义及数学模型如下:位置信息是音源的一个位置信息,是在某一坐标系内的一个坐标值。以听音者两耳中心位置为原点,可以在二维或三维空间内,进行定位,在其二维或三维的坐标系中,可以获取发音源位置的坐标数值。位置信息在二维空间内采用角度与距离值或者采用正交坐标系,在三维空间内采用三维笛卡尔坐标系。转码步骤中的位置信息无论是二维位置信息还是三维的位置信息,如(x,y)、(r,θ)、或(x,y,z)、(x,α,β)等,均可通过位置编码器将其转换为固定长度的二进制码。

在本发明中,为了使得位置信息与语音信息实现统一编码,进行编码步骤前,所述二进制位置信息缓存于缓存器BUF内,且语音数字信号通过码速调整器进行码速调整。然后,再确定声音与位置信息的一个对应方式,可以有两种不同处理方式:1)以固定时长T的语音信息匹配位置信息,T将会在编码的头部信息中进行说明,以适应不同场景的设计需求;2)以固定位宽L的语音信息匹配位置信息,L将会在编码的头部信息中进行说明,以适应不同场景的设计需求。

码速调整器将语音信息按照固定T时长或者固定位宽L的处理方式进行码速调整,然后找到二进制位置信息在语音数据流中插入的位置,语音合成器将位置信息插入语音数字信息中,实现统一编码。

以上所述,仅是本发明较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明以较佳实施例公开如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当利用上述揭示的技术内容作出些许变更或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明技术是指对以上实施例所作的任何简单修改、等同变化与修饰,均属于本发明技术方案的范围内。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东佳禾声学科技有限公司,未经广东佳禾声学科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610148864.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top