[发明专利]基于脉冲神经网络的应用于语音关键字识别的低功耗系统在审

专利信息
申请号: 202211144916.5 申请日: 2022-09-20
公开(公告)号: CN115440226A 公开(公告)日: 2022-12-06
发明(设计)人: 李丽;周攀;傅玉祥;王心沅;孙从怡;孙浩瀚;韩嘉宁;李伟;何书专 申请(专利权)人: 南京大学
主分类号: G10L15/34 分类号: G10L15/34;G10L15/26;G10L15/16
代理公司: 北京中先生知识产权代理事务所(普通合伙) 16063 代理人: 窦贤宇
地址: 210046 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明的基于脉冲神经网络的应用于语音关键字识别的低功耗系统包括:外部存储、上位机和脉冲神经网络硬件加速器,其中脉冲神经网络硬件加速器包括存储模块、控制器、调度器以及计算阵列;本发明提出了一种二维坐标存储结构存储脉冲神经元状态,一方面可以跳过神经元的无效状态,避免无效计算,基于脉冲神经网络的稀疏性,可以大幅降低计算量,另一方面可以降低检测有效状态的延时,有效提高资源利用率;提出了卷积直通池化,并行执行的方案,避免了传统设计中将中间卷积结果写回存储的环节,卷积结果存入FIFO后与下行结果直接两两池化,有效降低了存储访问次数,存储功耗也得以降低。设计了8路并行的计算架构,可以有效减少计算延时,补偿脉冲神经网络多步长的缺陷;经验证,本发明的语音关键词识别系统能够在保证较高准确率的前提下,同时具有功耗低、面积小的特点,适用于嵌入式、物联网等诸多应用领域,能够高效完成语音关键词识别任务。
搜索关键词: 基于 脉冲 神经网络 应用于 语音 关键字 识别 功耗 系统
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202211144916.5/,转载请声明来源钻瓜专利网。

同类专利
  • 针对高并发的语音AI节点统筹处理方法及装置-202310720865.4
  • 艾勇;王磊;张静 - 深圳博瑞天下科技有限公司
  • 2023-06-19 - 2023-09-08 - G10L15/34
  • 本发明公开了针对高并发的语音AI节点统筹处理方法及装置,涉及语音处理领域,其中,所述方法包括:获取批量并发语音请求;输出与批量并发语音请求对应的并发语音信号;将并发语音信号输入复杂度识别模块中,获取信号复杂度;根据语音拆分模块,以信号复杂度对并发语音信号进行拆分,获取信号拆分结果;并将信号拆分结果输入通道配置模块,生成多个并发处理节点,基于多个并发处理节点对并发语音信号进行多通道并行处理。解决了现有技术中针对高并发语音信号的识别精确度不足,以及高并发语音信号的识别效率低的技术问题。达到了提升高并发语音信号的识别精确度,提升高并发语音信号的识别效率、识别质量的技术效果。
  • 用于无线智能音频设备的片上系统和无线处理方法-202310560387.5
  • 许则挺;齐非凡;杨斌 - 恒玄科技(上海)股份有限公司
  • 2023-05-17 - 2023-09-05 - G10L15/34
  • 本申请涉及一种用于无线智能音频设备的片上系统和无线处理方法。所述片上系统包括第一处理器核和第二处理器核,所述第一处理器核的主频频率低于第二处理器核且功耗低于第二处理器核。第一处理器核获取音频数据;以及利用训练好的RNN网络来识别人声;在识别出人声的情况下,利用所述核间通信模块开启到核间通信,以便传输音频数据并使得所述第二处理器核唤醒。第二处理器核仅在唤醒情况下接收音频数据,并对所接收的音频数据进行AEC,并对除噪后的音频数据进行ASR,从而识别用户语音命令的关键词。如此,能够对不时出现的用户的语音命令中的关键词进行精确且及时的检出,避免片上系统的功耗过大,并且还能有效控制片上系统的成本。
  • 流式语音识别的方法及对应装置-202211680216.8
  • 杨叶新;张仕良;宫博 - 阿里巴巴达摩院(杭州)科技有限公司
  • 2022-12-26 - 2023-05-02 - G10L15/34
  • 本申请实施例公开了一种流式语音识别的方法及对应装置。其中方法包括:获取语音音频流;将利用第一时长单元对语音音频流进行分块得到的连续第一音频分块输入第一语音识别模型,得到各第一音频分块的识别结果用以展示;以及,将利用第二时长单元对语音音频流进行分块得到的连续第二音频分块输入第二语音识别模型,得到各第二音频分块的识别结果,其中第一时长单元小于第二时长单元,第二时长单元小于句子对应的音频时长;利用第二音频分块的识别结果更新对应第一音频分块的识别结果用以展示。本申请将识别结果的更新跳变限制在一个更小的范围内,从而改善了实时语音识别的显示效果,提升用户体验。
  • 语音方言识别方法、系统、设备及存储介质-202211542504.7
  • 魏贤;毛跃辉;梁博;陶梦春 - 珠海格力电器股份有限公司
  • 2022-12-02 - 2023-04-25 - G10L15/34
  • 本发明实施例公开了语音方言识别方法、系统、设备及存储介质,其中,方法包括:智能空调器若检测到命令类型数据,将命令类型数据及本地已存储的方言标签发送至云端服务器;云端服务器通过命令类型数据和方言标签进行意图识别得到意图识别结果,获取与意图识别结果对应的动作控制数据,并将动作控制数据发送至智能空调器;智能空调器接收动作控制数据并执行对应的操作。本发明实施例不仅可以对用户以方言类型语音发出的命令类型数据得到精准识别,而且还可以基于识别结果对应控制智能空调器。
  • 用于优化语音识别过程的方法、设备和存储介质-202110564902.8
  • 李丽丽;张广勇;段亦涛 - 网易有道信息技术(北京)有限公司
  • 2021-05-24 - 2023-04-18 - G10L15/34
  • 本发明的实施方式提供了一种用于优化语音识别过程的方法、设备和存储介质。该方法包括:响应于接收到待识别语音信息,使用第一处理器对所述待识别语音信息进行特征提取,以获得所述待识别语音信息的特征信息;使用不同于所述第一处理器的第二处理器对所述特征信息进行基于神经网络模型的推理运算;以及使用所述第一处理器对所述推理运算的运算结果进行解码处理,以获得所述待识别语音信息的语音识别结果。根据本发明实施方式的方法,可以充分利用每个处理器的计算能力,并且显著降低设备的功耗,以实现减少延时和延长设备续航能力的目的,为用户带来了更好的体验。
  • 用于语音识别的处理器-202010416486.2
  • 张国飙 - 杭州海存信息技术有限公司
  • 2017-03-07 - 2023-04-07 - G10L15/34
  • 用于语音识别的处理器为一种分布式模式处理器,它根据自身存储的声学/语言模型对输入的语音数据进行语音识别。该处理器含有多个存储处理单元,每个存储处理单元都含有一个包括语音识别电路的模式处理电路和至少一个存储至少部分声学/语言模型的三维存储(3D‑M)阵列。模式处理电路中的所有晶体管均位于一半导体衬底中;3D‑M阵列中的所有存储元均不位于任何半导体衬底中。
  • 用于语音识别的方法、装置、设备、车辆和介质-202211426023.X
  • 魏萌;徐培来 - 北京宾理信息科技有限公司
  • 2022-11-14 - 2023-03-07 - G10L15/34
  • 提供了一种用于语音识别的方法、装置、设备、车辆和存储介质。上述用于语音识别的方法应用于终端设备,终端设备包括端对端语音识别神经网络模型的编码器,该方法包括:获取语音音频流;从语音音频流中提取声学特征,得到声学特征序列;利用编码器对声学特征序列进行编码,得到编码器输出的编码特征序列,其中,编码特征序列包括至少一个编码特征向量;将编码特征序列传输至云端设备,以供云端设备处理,其中,云端设备包括端对端语音识别神经网络模型的解码器;以及接收来自云端设备的语音识别结果,其中,语音识别结果由解码器对编码特征序列进行处理得到。
  • 音频处理方法、电子设备以及存储介质-202111165223.X
  • 姜振旭;余艳辉 - 荣耀终端有限公司
  • 2021-09-30 - 2023-01-10 - G10L15/34
  • 本申请实施方式提供了一种音频处理方法、电子设备以及计算机可读存储介质。音频处理方法包括:硬件驱动层获取到待播放的音频数据;硬件驱动层对音频数据进行语音增强处理,以得到音频数据的增强数据;硬件驱动层将音频数据和音频数据的增强数据发送至电子设备的应用层;应用层基于增强数据,得到对音频数据进行语音识别的语音识别结果;应用层控制电子设备输出音频数据,并在输出音频数据时,控制电子设备输出语音识别结果。本申请中,语音增强处理是在硬件驱动层执行的,而非在应用层执行的。本申请可以较为显著地改善字幕与音频的不同步问题。
  • 基于脉冲神经网络的应用于语音关键字识别的低功耗系统-202211144916.5
  • 李丽;周攀;傅玉祥;王心沅;孙从怡;孙浩瀚;韩嘉宁;李伟;何书专 - 南京大学
  • 2022-09-20 - 2022-12-06 - G10L15/34
  • 本发明的基于脉冲神经网络的应用于语音关键字识别的低功耗系统包括:外部存储、上位机和脉冲神经网络硬件加速器,其中脉冲神经网络硬件加速器包括存储模块、控制器、调度器以及计算阵列;本发明提出了一种二维坐标存储结构存储脉冲神经元状态,一方面可以跳过神经元的无效状态,避免无效计算,基于脉冲神经网络的稀疏性,可以大幅降低计算量,另一方面可以降低检测有效状态的延时,有效提高资源利用率;提出了卷积直通池化,并行执行的方案,避免了传统设计中将中间卷积结果写回存储的环节,卷积结果存入FIFO后与下行结果直接两两池化,有效降低了存储访问次数,存储功耗也得以降低。设计了8路并行的计算架构,可以有效减少计算延时,补偿脉冲神经网络多步长的缺陷;经验证,本发明的语音关键词识别系统能够在保证较高准确率的前提下,同时具有功耗低、面积小的特点,适用于嵌入式、物联网等诸多应用领域,能够高效完成语音关键词识别任务。
  • 一种语音识别方法和装置-201911367380.1
  • 周鹏;宋碧霄 - 思必驰科技股份有限公司
  • 2019-12-26 - 2022-09-23 - G10L15/34
  • 本发明公开了一种语音识别的方法,应用于云端服务器,该方法包括:接收客户端发送的语音识别请求;获取所述语音识别请求中携带的唤醒词文本数据;根据所述唤醒词文本构建对应的唤醒词模型;将所述唤醒词模型和通用语言模型连接;使用所述连接后的唤醒词模型和通用语言模型对所述语音识别请求中携带的语音进行识别。
  • 基于蓝牙耳机的远程控制系统及方法-202111268122.5
  • 李加云 - 歌尔科技有限公司
  • 2021-10-28 - 2022-02-25 - G10L15/34
  • 本发明涉及无线通信技术领域,公开了一种基于蓝牙耳机的远程控制系统及方法,所述系统包括:目标蓝牙耳机、充电盒、云端控制服务器以及移动终端,目标蓝牙耳机接收目标用户发出的语音信息;充电盒将语音信息转发至云端控制服务器;云端控制服务器根据语音信息生成目标控制指令;移动终端根据目标控制指令确定目标文件,将目标文件反馈至目标蓝牙耳机;由于本发明是通过充电盒将目标蓝牙耳机接收的语音信息进行转发,通过云端控制服务器根据语音信息生成目标控制指令,通过移动终端根据目标控制指令确定目标文件,将目标文件反馈至目标蓝牙耳机,相较于现有技术仅近距离才能控制移动终端,能够有效增加蓝牙耳机的适用范围,并降低用户的隐私泄露。
  • 基于云端的语音处理方法和装置-201711079226.5
  • 钱胜 - 百度在线网络技术(北京)有限公司
  • 2017-11-06 - 2021-12-17 - G10L15/34
  • 本发明提出一种基于云端的语音处理方法和装置,其中,方法包括:获取终端采集的待识别的语音;对待识别的语音进行语音识别;在语音识别的过程中,同时检测待识别的语音是否结束;当检测到待识别的语音结束时,将待识别的语音的识别结果反馈给终端。通过在语音的识别过程中,同时检测待识别的语音是否结束,从而可以保证语音识别的准确性。进一步地,由云端进行语音识别,与终端本地无关,因此和硬件平台无关,不存在迁移开发,且不受终端本地资源的限制,因此,云端使用的语音识别模型可以做的非常复杂精细,从而可以提升系统的抗干扰性能。此外,云端使用的语音识别模型,已经为不同的应用量身打造,无需重新训练模型,简化了开发量。
  • 基于PUFs的说话人问答交互系统-202120858390.1
  • 李冰;吴佳欣;张熠;张言;杨霞;袁鹏伟 - 东南大学深圳研究院;东南大学
  • 2021-04-25 - 2021-12-10 - G10L15/34
  • 本实用新型公开了基于PUFs的说话人问答交互系统,包括若干用户便携设备、硬件交互系统和云端服务器;硬件交互系统包括接收语音信号的内嵌PUFs电路的Raspberry Pi基站、基于Raspberry Pi的ReSpeaker 4‑Mic阵列和智能机器人主控平台;所述Raspberry Pi基站通过WIFI模块与所述云端服务器连接;所述Raspberry Pi基站通过ReSpeaker 4‑Mic阵列与用户便携设备连接,Raspberry Pi基站通过ReSpeaker 4‑Mic阵列接收用户便携设备的语音信号;所述Raspberry Pi基站连接有智能机器人主控平台和用户便携设备;本系统保证了用户信息的安全性,避免用户信息被窃取而导致的不良后果。
  • 语音识别网络延时优化方法及装置-201811320280.9
  • 潘通 - 思必驰科技股份有限公司
  • 2018-11-07 - 2021-11-30 - G10L15/34
  • 本发明公开一种语音识别网络延时优化方法,包括:对当前收录到的语音信号进行语音处理,以得到语音识别数据并输入至缓存器;从所述缓存器中获取预设时长的语音识别数据,所述预设时长具有初始时长值;对所述预设时长的语音识别数据进行解码处理,以得到相应的解码后的语音识别数据;解析所述解码后的语音识别数据得到语义解析结果,并判断所述语义解析结果是否能够表达完整语义;如果是,则输出所述语义解析结果。本发明实施例的语音识别网络延时优化方法,可以边说话就边解码,而不是像以前一样,要等到这句话结束后才能够进行解码,达到一个既快又好的效果。
  • 语音识别方法及装置-202110995270.0
  • 王林霄 - 上海哔哩哔哩科技有限公司
  • 2021-08-27 - 2021-11-26 - G10L15/34
  • 本申请公开了一种语音识别方法。该方法包括:接收语音识别请求,所述语音识别请求包括待识别语音;确定所述待识别语音的语音长度;采用与所述语音长度相匹配的语音识别方式对所述待识别语音进行语音识别,得到语音识别结果。本申请可减少语音识别所需时间。
  • 一种信息处理方法、服务器、终端及信息处理系统-201610377389.0
  • 酆怡祖;李斌 - 华为终端有限公司
  • 2016-05-31 - 2021-10-26 - G10L15/34
  • 一种信息处理方法、服务器、终端及信息处理系统,在处理第一终端发出的查询信息时,可不只依赖于服务器从数据库中搜索回复信息,还可从与所述第一终端相对应的第二终端获取与所述查询信息相关的回复信息,可有效避免服务器侧无法从数据库中搜索到与所述查询信息相关的答案从而向用户提供无效答案的情况发生,提高人机对话的通话质量。
  • 一种语音交互方法、装置、电子设备及存储介质-201911402606.7
  • 刘浩;耿磊 - 北京猎户星空科技有限公司
  • 2019-12-30 - 2021-07-16 - G10L15/34
  • 本发明实施例提供了一种语音交互方法、装置、电子设备及存储介质,涉及数据处理技术领域,包括:在检测到待识别语音开始后,请求与服务端建立连接;若第一预设时长内未成功与所述服务端建立连接,基于离线语音识别模型对采集到的待识别语音进行识别,得到离线识别结果并显示;所述第一预设时长后若与所述服务端成功建立连接,向所述服务端发送所述待识别语音,接收所述服务端发送的所述待识别语音的云端识别结果;在检测到待识别语音结束后,若满足更新要求,根据所接收的云端识别结果,更新显示的识别结果。应用本发明实施例提供的方案可以提高语音交互效率。
  • 汉语精准识别的智能化语音控制方法及系统-202011255685.6
  • 林泽森;黄碧亮 - 深圳市小顺智控科技有限公司
  • 2020-11-11 - 2021-06-29 - G10L15/34
  • 本申请实施例提供一种汉语精准识别的智能化语音控制方法,所述方法应用于终端,其中,所述方法包括如下步骤:终端采集目标对象的语音数据,将该语音数据进行特征提取得到输入数据;终端将该输入数据输入到第一神经网络模型执行运算得到第一运算结果,将该输入数据输入到第二神经网络模型执行运算得到第二运算结果;终端依据第一运算结果得到语音数据的第一文字结果,依据第二运算结果得到语音数据的第二文字结果,将第一文字结果与第二文字结果进行对比确定语音数据的最终文本结果,生成该文本结果对应的控制命令实现语音控制。本申请提供的技术方案具有用户体验度高的优点。
  • 基于多设备的语音处理方法及系统-202011501007.3
  • 王云华;王妍 - 深圳TCL新技术有限公司
  • 2020-12-17 - 2021-04-23 - G10L15/34
  • 本发明涉及语音处理技术领域,公开了一种基于多设备的语音处理方法及系统,所述方法包括:获取语音指令信息,并从语音指令信息中提取对应的脉冲编码调制数据;获取预先关联的多个智能设备的设备标识,并根据设备标识获取各智能设备的运行状态信息;根据运行状态信息通过云端服务器对脉冲调制数据进行语音识别处理,获得语音识别结果;根据语音识别结果从多个智能设备选取一目标智能设备对语音识别结果进行响应。通过根据多个智能设备的运行状态信息结合云端服务器对语音指令信息进行语音识别处理,再根据语音识别结果选取对应的目标智能设备进行响应,实现了智能设备和云端协同工作,提高了在线语音处理的响应速度和用户的语音交互体验。
  • 一种智能语音分析装置-202021283898.5
  • 余东海;洪卫丹;张华烨 - 杭州融轩信息技术有限公司
  • 2020-07-04 - 2021-02-23 - G10L15/34
  • 本实用新型公开了一种智能语音分析装置,包括识别进程管理模块、识别处理进程管理模块模块、系统管理模块、NFS文件存取模块、缓冲录音进程模块和识别client语音数据交互模块,所述识别进程管理模块分别连接远端识别控制接口、系统管理模块和识别处理进程管理模块,所述识别处理进程管理模块分别连接NFS文件存取模块、缓冲录音进程模块和识别client语音数据交互模块,所述识别client语音数据交互模块连接云识别服务器,所述云识别服务器连接语音识别控制接口。本实用新型提供声纹检测识别、语音关键词识别及将语音内容转化为文字等功能,功能齐全,满足移动业务和各类增值业务全方位需求。
  • 一种基于物联网的语音识别系统-202010676721.X
  • 唐玲香 - 广州狸园科技有限公司
  • 2020-07-14 - 2020-10-16 - G10L15/34
  • 本发明属于语音识别技术领域,具体公开了一种基于物联网的语音识别系统,包括语音听写模块、信息转换模块和数据收集模块,所述语音听写模块通过导线与信息转换模块电性输出连接,且信息转换模块通过导线与信息储存模块电性输出连接,所述信息储存模块通过导线与数据收集模块电性输出连接,且数据收集模块通过导线与数据处理模块电性输出连接。该基于语音识别的监控模块可以通过语言分析单元、数据集成单元、量化处理单元和数据发送单元,可以对物联网进行语音识别,可以将说出来的语言进行网络搜索分析,将语言定位成功后再传送到信息转换模块进行文字转换和网络监控,对转换的信息内容进行监控识别。
  • 信息传播系统以及其方法-202010477292.3
  • 陈圣;张皓军;陈泓谕;林贸鸿;林宏锜 - 美律电子(深圳)有限公司
  • 2020-05-29 - 2020-09-29 - G10L15/34
  • 本发明提供一种信息传播系统,包括第一电子装置以及路由器。第一电子装置接收第一声音信号,并依据语音识别演算法来识别第一声音信号,以产生第一地址信息以及第一编码信息内容。路由器连接至局域网络,用以接收第一编码信息内容并对第一编码信息内容进行语意解析以产生解析结果。路由器并通过局域网络发送解析结果。路由器依据第一地址信息以判断第一地址信息所指示的第一地址是否在局域网络中,以将解析结果发送至对应第一地址的至少一第二电子装置。
  • 进行现场会议的方法、系统及装置、外接语音助手设备-202010353929.8
  • 李智诚;张云翔;饶竹一;李厚恩;黄安子 - 深圳供电局有限公司
  • 2020-04-29 - 2020-08-18 - G10L15/34
  • 本发明涉及进行现场会议的方法及其系统、外接语音助手设备,所述方法包括:进行现场会议时,接收参会人员发出的第一语音信息,并将所述第一语音信息发送至云端以唤醒云端的语音识别功能;在唤醒云端的语音识别功能之后,接收参会人员发出的第二语音信息,并将所述第二语音信息发送至云端;将所述第二语音信息发送至云端之后,接收云端返回的控制指令;将所述控制指令发送至会议计算机设备,以控制所述会议计算机设备执行相应任务。所述系统与所述方法对应,所述外接语音助手设备包括所述系统,实施本发明能够提高现场会议的会议效率和流畅度。
  • 一种支持多云端语音服务的方法及一种存储设备-201710841078.X
  • 陈长海 - 瑞芯微电子股份有限公司
  • 2017-09-15 - 2020-08-14 - G10L15/34
  • 本发明涉及智能语音交互领域,特别涉及一种支持多云端语音服务的方法及一种存储设备。所述一种支持多云端语音服务的方法,包括如下步骤:获取语音数据;对语音数据进行处理,并对处理后的语音数据进行唤醒词模板匹配;若有匹配的唤醒词,则根据匹配的唤醒词唤醒对应云端,并传输所述语音数据至对应云端;根据云端返回的结果执行相应操作,以响应语音数据。整个过程中,用户可以根据自己想要唤醒的任意一个云端,在同一个设备上进行对应的语音数据输入,对应云端将被唤醒,并且对所述语音数据进行处理,执行对应操作。使得用户无需拥有多个设备,就可以享受不同云端语音交互的服务,大大节约成本,也提升用户体验。
  • 一种基于语音识别的在线数据采集仪-201921688375.6
  • 郑玉玉;杨事廉;吴清泉;程丹 - 安徽环美智能科技有限公司
  • 2019-10-10 - 2020-07-17 - G10L15/34
  • 本实用新型公开了一种基于语音识别的在线数据采集仪,涉及环保设备领域。本实用新型包括数据采集仪数据处理组件、语音识别组件和电源模块;数据采集仪数据处理组件包括数据采集仪ARM模块;数据采集仪ARM模块联接有4G模块、以太网模块、音频输出模块以及LCD液晶显示模块;语音识别组件包括在线语音识别云平台和离线语音识别模块;在线语音识别云平台和离线语音识别模块均与数据采集仪数据处理组件保持信息的交互;电源模块分别与数据采集仪数据处理组件和语音识别组件相联接;电源模块用于为数据采集仪数据处理组件和语音识别组件提供电能支撑。本实用新型通过将语音识别技术融入到数据采集仪系统中,能够实现人机交互,具有较高的市场应用价值。
  • 一种语音外呼系统-201811587646.9
  • 石丹丹;易芬 - 圆通速递有限公司
  • 2018-12-25 - 2019-04-16 - G10L15/34
  • 本发明公开了一种语音外呼系统,通过智能语音外呼耳机,解放派件员双手,根据派件员要求确认收件客户时间及地点,为派件员派件带来便利,同时提高派件效率。其技术方案为:本发明的语音外呼系统为派件员提供智能语音唤醒服务,系统基于派件员要求,通过调用应用系统平台拨打收件客户手机,实现派件员与收件客户确定派件时间和地点的目的,从而解放派件员双手,提高了派件效率。
  • 语音识别系统-201821181912.3
  • 刘建 - 江苏安怡臣信息技术有限公司
  • 2018-07-24 - 2019-03-29 - G10L15/34
  • 本实用新型公开了一种语音识别系统,涉及语音识别领域,解决了云端语音识别服务器在长期工作中发热,而影响服务器的工作技术问题,其技术方案要点是:包括云端语音识别服务器、罩设在云端语音识别服务器外的U型冷却罩、转动连接在冷却罩相对内壁上端的转轴、固定在转轴上若干扇形的第一转板,各个所述第一转板沿转轴的轴线分布,所述转轴的一端伸出冷却罩,且所述冷却罩在转轴延伸出的一端设有驱动转轴转动的电机;其优点是,利于对云端语音识别服务器进行散热。
  • 实现多语种混合使用的语音识别方法-201510489060.9
  • 于拾全;卫亚东;田学红 - 东莞市凡豆信息科技有限公司
  • 2015-08-11 - 2019-03-12 - G10L15/34
  • 本发明公开了一种实现多语种混合使用的语音识别方法,涉及语音识别技术领域。包括如下步骤:在云端提供多种语音识别服务器和一个识别文本后处理服务器;用户通过终端把实时语音通过网络同时传送给多个语音识别服务器;多个语音识别服务器同时进行语音识别,然后把各自的识别结果文本发送给识别文本后处理服务器,进行处理;识别文本后处理服务器根据整体语义的解析,提供第一种语言结果中的有效部分M,以及第二种语言结果中的有效部分N,然后将M和N拼接成最终的识别结果,通过网络发送给用户终端;用户终端获取到多种语音混用的正确识别结果。所述方法能够实现对多种混合使用的语音信息进行有效识别,扩大了应用范围。
  • 一种语音识别系统和方法-201810758940.5
  • 余启洪;柳青;宋征轩;张海龙 - 北京智能管家科技有限公司
  • 2018-07-11 - 2018-12-18 - G10L15/34
  • 本发明实施例公开了一种语音识别系统和方法,所述系统包括:引擎资源调度模块和至少两个引擎处理模块;其中,所述引擎资源调度模块用于根据所述至少两个引擎处理模块的状态选择目标引擎处理模块;所述至少两个引擎处理模块中的目标引擎处理模块用于对接收到的语音数据进行语音识别。由于引擎资源调度模块对引擎处理模块的调度,可以让处于空闲状态的引擎处理模块进行语音识别,避免了多个语音数据同时由一个引擎处理模块处理时造成的资源竞争,降低识别效率的问题,实现了在高并发情况下提升语音识别引擎的识别率和使用效率,同时去除引擎处理模块识别多路语音的复杂设计。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top