[发明专利]用于语音识别的处理器在审
申请号: | 201710460362.2 | 申请日: | 2017-03-07 |
公开(公告)号: | CN107393537A | 公开(公告)日: | 2017-11-24 |
发明(设计)人: | 张国飙 | 申请(专利权)人: | 杭州海存信息技术有限公司 |
主分类号: | G10L15/34 | 分类号: | G10L15/34 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310051*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 语音 识别 处理器 | ||
技术领域
本发明涉及集成电路领域,更确切地说,涉及用于语音识别的处理器。
背景技术
模式匹配和模式识别指在目标模式(被检索的模式,target pattern)中查找与检索模式(用于检索的模式,search pattern)相同或接近的模式。其中,模式匹配要求查找到相同的模式,模式识别仅要求查找到接近的模式。除了特别说明,本说明书不区分模式匹配和模式识别,并用模式处理来统称各种对模式进行的操作。
模式处理(包括模式匹配和模式识别)应用广泛。常用的模式处理包括字符串匹配、代码匹配、语音识别和图像识别等。字符串匹配广泛用于大数据分析(如金融数据分析、电商数据分析、生物信息学)等领域:从大数据(目前多为文本数据库,含有目标字符串)中查找检索字符串,并进行统计分析。代码匹配广泛用于防恶意软件(anti-malware,如网络安全、计算机杀毒)等领域:从网络数据包中查找病毒标识(virus signature)或检查网络数据包是否符合网络规范(network rules),从而决定网络数据包是否安全。语音识别将通过语音传感器搜集到、或存储在语音档案库中的语音信号与声学模型库和语言模型库匹配。图像识别将通过图像传感器搜集到、或存储到图像档案库中的图像信号与图像模型库匹配。
随着大数据时代的到来,传统的模式库(包括检索模式库和目标模式库)已成为大型数据库(TB级到PB级,甚至EB级):检索模式库(包括所有用于检索的模式)的数据量已经很大,而目标模式库(包括所有被检索的模式,通常为用户数据库)的数据量则更为巨大。目前计算机采用的von Neumann架构已不能满足大数据时代对模式处理的要求。在von Neumann架构中,用于处理模式的处理器和用来存储模式的存储器是分离的:存储器(如硬盘、光盘、磁带等)仅用作存储模式数据,而不能对它进行任何模式处理;所有的模式处理都由外置处理器(如CPU、GPU)来完成。众所周知,分离的处理器和存储器之间带宽有限,光是从模式库中读出所有数据就需要很长时间,更何况对它们进行处理分析。因此,对大型模式库的模式处理需要耗费很长时间。
模式处理的一个典型应用是语音识别。语音识别的一种手段是根据声学模型库和语言模型库对用户语音进行模式识别。其中,声学模型库存储大量的声学模型;语言模型库存储大量的语言模型。在识别时,模式处理器将用户语音数据与声学模型库中的声学模型或语言模型库中的语言模型进行模式识别,寻找最接近的声学模型和语言模型。由于传统语音处理器(如CPU、GPU)内核数量有限、模式识别平行度较低,且声学模型库和语言模型库存储在外存(如硬盘)中、语音处理器获取声学模型和语言模型耗时较长,故传统语音处理器在处理语音识别时效率低下。
发明内容
本发明的主要目的是提高语音识别的效率。
本发明的另一目的是提供一种能高效地进行语音识别的处理器。
为了实现这些以及别的目的,本发明提出一种用于语音识别的处理器,它是一种含有三维存储(three-dimensional memory,简称为3D-M)阵列的分布式模式处理器:该处理器不仅能存储模式数据,还能对它实施模式处理。一个模式处理器芯片含有多个存储处理单元,每个单元都含有一模式处理电路和至少一存储至少一模式(包括目标模式和检索模式)的3D-M阵列。3D-M阵列与模式处理电路的垂直集成带来很多优势:由于3D-M阵列不占衬底面积,它可以集成在模式处理电路上,这能增加存储容量、减少芯片面积。更重要的是,由于3D-M阵列和模式处理电路处于同一芯片中且距离很近,它们之间能实现一大带宽电连接。通过采用大规模平行计算(每个分布式模式处理器芯片可以含有上万个存储处理单元),分布式模式处理器能对大型模式库实现快速模式处理。
相应地,本发明提出一种用于语音识别的处理器(200),其特征在于含有:一传输至少一用户语音数据的输入总线(110);一半导体衬底(0)及多个存储处理单元(100aa-100mn),所述多个存储处理单元与该输入总线(110)耦合,每个存储处理单元(100ij)含有至少一三维存储 (3D-M)阵列(170)和一模式处理电路(180),其中:所述3D-M阵列(170)堆叠在该衬底(0)上方,该3D-M阵列(170)存储至少一声学模型(或语言模型);所述模式处理电路(180)位于该衬底(0)中,该模式处理电路(180)根据该声学模型(或语言模型)对该用户语音数据进行模式识别;所述3D-M阵列(170)和所述模式处理电路(180)通过多个接触通道孔(1av, 3av)耦合。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海存信息技术有限公司,未经杭州海存信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710460362.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:响应特定音频信号的蜂鸣提示家电遥控设备
- 下一篇:电子设备