[发明专利]用于语音识别的计算装置和用于计算装置上的语音识别的方法有效
申请号: | 201380075764.0 | 申请日: | 2013-05-20 |
公开(公告)号: | CN105122353B | 公开(公告)日: | 2019-07-09 |
发明(设计)人: | W.德利厄夫 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G06K9/00;G06K9/20 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 徐予红;付曼 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 虚拟 个人 助理 系统 自然人 计算机 交互 | ||
1.一种用于语音识别的计算装置,所述计算装置包括:
音频传感器;
音频输入模块,用于:
使用所述音频传感器捕获音频输入;以及
使所述音频输入失真以产生多个失真的音频变化;以及
语音识别模块,用于:
对所述音频输入和每一个所述失真的音频变化执行语音识别以产生多个语音识别结果;以及
基于上下文信息从所述语音识别结果中选择结果。
2.如权利要求1所述的计算装置,其中使所述音频输入失真包括如下至少一项:(i)移除具有与幅度阈值具有预定义关系的幅度的所述音频输入的内部片段;或者(ii)扩大具有与幅度阈值具有预定义关系的幅度的所述音频输入的片段的长度。
3.如权利要求1所述的计算装置,其中使所述音频输入失真包括在通过对所述音频输入执行语音识别所标识的所述音频输入的语音分割点插入暂停。
4.如权利要求1所述的计算装置,其中使所述音频输入失真包括如下至少一项:(i)加速所述音频输入;(ii)减慢所述音频输入;(iii)调整所述音频输入的音调;或者(iv)向所述音频输入引入噪声。
5.如权利要求1所述的计算装置,还包括具有语音识别语法的一个或多个应用;
其中所述语音识别模块还将基于所述一个或多个应用的所述语音识别语法确定所述语音识别结果的语义相关结果;并且
其中从所述语音识别结果中选择结果包括从所述语义相关结果中选择结果。
6.如权利要求5所述的计算装置,其中所述一个或多个应用包括虚拟个人助理。
7.一种用于计算装置上的语音识别的方法,所述方法包括:
使用所述计算装置的音频传感器捕获音频输入;
使所述音频输入失真以产生多个失真的音频变化;
对所述音频输入和每一个所述失真的音频变化执行语音识别以产生多个语音识别结果;以及
基于上下文信息从所述语音识别结果中选择结果。
8.如权利要求7所述的方法,其中使所述音频输入失真包括如下至少一项:(i)移除具有与幅度阈值具有预定义关系的幅度的所述音频输入的内部片段;或者(ii)扩大具有与幅度阈值具有预定义关系的幅度的所述音频输入的片段的长度。
9.如权利要求7所述的方法,其中使所述音频输入失真包括在通过对所述音频输入执行语音识别所标识的音频输入的语音分割点插入暂停。
10.如权利要求7所述的方法,其中使所述音频输入失真包括执行如下至少一项:(i)加速所述音频输入;(ii)减慢所述音频输入;(iii)调整所述音频输入的音调;或者(iv)向所述音频输入引入噪声。
11.如权利要求7所述的方法,还包括:基于所述计算装置的一个或多个应用的语音识别语法确定所述语音识别结果的语义相关结果;
其中从所述语音识别结果中选择结果包括从所述语义相关结果中选择结果。
12.如权利要求11所述的方法,其中基于所述一个或多个应用的所述语音识别语法确定所述语义相关结果包括:基于所述计算装置的虚拟个人助理的语音识别语法确定所述语义相关结果。
13.一种计算机可读介质,其上存储有指令,所述指令在被执行时使得计算机执行如权利要求7-12中的任一个所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380075764.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多圆筒式顶灯
- 下一篇:一种背光模组及显示装置