[发明专利]声学处理单元接口有效
申请号: | 201280070114.2 | 申请日: | 2012-12-18 |
公开(公告)号: | CN104137178B | 公开(公告)日: | 2018-01-19 |
发明(设计)人: | V·纳塔拉詹;S·罗斯内 | 申请(专利权)人: | 赛普拉斯半导体公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/01 |
代理公司: | 北京安信方达知识产权代理有限公司11262 | 代理人: | 陆建萍,郑霞 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声学 处理 单元 接口 | ||
技术领域
本发明的实施例一般关于语音辨识。更详而言之,本发明的实施例有关于声学建模过程在专用处理单元上的实施。
背景技术
即时数据模式的辨识逐渐被用于分析电子系统中的数据串流。在具有数以万字的词汇上,语音辨识系统已达到更高的精度,使其成为对于电子系统而言具吸引力的特征。举例而言,语音识别系统针对数据模式辨识的应用也越来越常见于在消费市场中,例如,行动装置,服务器,汽车,以及个人电脑的市场。
尽管在语音识别系统中有改良的精确度,显著计算资源专用于语音识别程序,依次设置显著负载于计算系统,例如,多用户/多程式环境。多程式的计算系统同时处理来自不同应用程式的数据,因此,由语音识别过程设在这些计算系统上的负载影响了该计算系统可处理传入的声音信号以及来自其他应用程式的数据的速度。此外,对于通常包括有限的存储器资源(相对于桌面计算系统)的手持装置,语音识别应用不仅设置显著负载于手持装置的计算资源上,而且消耗该手持装置的存储器资源的显著部分。上述语音识别系统的处理能力、速度和存储器资源的问题会因需要处理即时或实质上接近即时的输入声音信号而进一步恶化。
发明内容
因此,有必要改善语音识别系统对计算系统的处理能力、速度、以及存储器资源方面的负载。
于一实施型态中,提供一种语音辨识系统。该系统包括一处理单元用以将一接收到的音频信号分割成具有各别帧向量的连续性帧、一声学处理单元(APU)、一数据总线用以耦合该处理单元和该声学处理单元。该声学处理单元包含一局部非易失性存储器用以储存多个聚类状态、一耦合该存储器的记忆缓冲器、以及一计分单元,该声学处理单元用以将至少一储存于该存储器的高斯机率分布向量加载至该记忆缓冲器中,该计分单元用以同时比较一加载至该记忆缓冲器的高斯机率分布向量的多个维度和一从该处理单元接收的帧向量的各别维度,并输出一对应分数至该处理单元。该声学处理单元使用一第一帧来执行一比较而该处理单元使用一对应一第二帧的分数来执行一搜寻操作,该第二帧紧接着先前的该第一帧。
于本发明的另一实施型态包括一声学处理方法。该方法包括使用一处理单元将一接收到的音频信号分割成多个帧,使用一声学处理单元(APU)去比较一与该多个帧中的一第一帧相关的特征向量和一高斯机率分布向量以产生一分数,以及在比较同时,使用该处理单元使用对应于与从一声学处理单元(APU)所接收到的该多个帧中的一第二帧相关的特征向量的分数进行搜寻操作,其中,该第二帧紧接着该第一帧,且其中,该处理单元与该声学处理单元耦合在一数据总线上。
进一步实施型态包括一种计算器可读取媒体,具有存于其中的由一个或多个处理器所执行的一个或多个指令中的一个或多个序列,用以执行一声学处理方法。该方法包含使用一处理单元将一接收到的音频信号分割成多个帧,输出一与该多个帧中的一第一帧相关的特征向量至一声学处理单元,其中,该声学处理单元用以比较该第一帧和一高斯机率分布向量以产生一分数,以及在比较同时,使用该处理单元使用对应于与从一声学处理单元(APU)所接收到的该多个帧中的一第二帧相关的特征向量的分数进行搜寻操作,其中,该第二帧紧接着该第一帧,且其中,该处理单元与该声学处理单元耦合在一数据总线上。
本发明的实施例的进一步特征与优点,以及本发明的不同实施例中的架构与运作,皆参照附图被加以详细描述。值得注意的是,本发明并不限于本文所述的具体实施例。这样的实施方案在本文中提出,仅供参考。其他的实施例对于熟习此技艺的相关领域人士而言将是显而易见的。
附图说明
在此引入附图并构成本说明书的一部分,附图示出了本发明的实施例,并与说明书一起,进一步用于解释本发明的原理,并使得该领域中熟习此技艺的人士能够实施或使用本发明。
图1根据本发明的实施例的语音识别过程的示范流程示意图。
图2为现有的语音辨识系统的示意图。
图3是现有的语音识别系统与由个别处理单元执行的语音识别过程的示意图。
图4是在由声学处理单元(APU)和中央处理单元(CPU)执行的语音识别过程的实施例示意图。
图5是语音识别系统的周边控制器接口(PCI)的总线架构的实施例示意图。
图6是语音识别系统的进阶周边总线(APB)架构的实施例示意图。
图7是语音识别系统的低功耗双倍数据速率(LPDDR)总线架构的实施例示意图。
图8是语音识别系统中的系统级架构实施例示意图。
图9是数据模式分析方法的一实施例示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赛普拉斯半导体公司,未经赛普拉斯半导体公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280070114.2/2.html,转载请声明来源钻瓜专利网。