[发明专利]一种语音识别方法和客户端有效
申请号: | 201210048232.5 | 申请日: | 2012-02-27 |
公开(公告)号: | CN103295575B | 公开(公告)日: | 2019-01-25 |
发明(设计)人: | 苏腾荣;朱璇 | 申请(专利权)人: | 北京三星通信技术研究有限公司;三星电子株式会社 |
主分类号: | G10L15/30 | 分类号: | G10L15/30;G10L15/02 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 王一斌;王琦 |
地址: | 100125 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 客户端 | ||
本发明提供了一种语音识别方法,该方法包括:客户端判断当前的语音识别应用是否涉及隐私,如果是,则由客户端对采集到的语音信号进行语音识别;否则,进一步判断与服务器是否成功建立连接,如果成功建立连接,由服务器对采集到的语音信号进行语音识别;如果不成功建立连接,由客户端对采集到的语音信号进行语音识别。本发明同时公开了一种语音识别中的客户端,应用本发明所述的语音识别方法和客户端,能够实现对包含隐私的语音数据进行语音识别,且不受网络条件是否支持的限制。
技术领域
本发明涉及语音识别技术领域,特别涉及一种语音识别方法和客户端。
背景技术
图1为现有语音识别方法的工作流程图,如图1所示,该流程包括:
步骤101:服务器与客户端建立连接后,接收由客户端发送的语音信号。
步骤102:服务器接收到语音信号后,提取语音信号中的语音识别特征,根据语音识别模型对语音识别特征进行语音识别。
步骤103:服务器将语音识别后得到的识别结果返回给客户端。
至此,即完成了现有语音识别方法的整个工作流程。
通过上述分析可以看出,首先,由于现有语音识别在服务器端进行,当用户不愿将包含隐私的语音数据上传到服务器时,也就无法完成这类语音数据的语音识别;其次,现有的语音识别方法是在服务器端进行的,使得语音识别受到网络条件的限制,当网络条件不支持时,也就无法完成语音识别;最后,现有语音识别方法没有针对用户和环境进行自适应,因此,当用户存在多样性以及用户使用时环境多变性的情况下,服务器是无法提供可靠的语音识别服务的。
发明内容
有鉴于此,本发明提供了一种语音识别方法,能够对包含隐私的语音数据进行语音识别,且不受网络条件是否支持的限制。
本发明还公开了一种语音识别中的客户端,能够对包含隐私的语音数据进行语音识别,且不受网络条件是否支持的限制。
为了达到上述目的,本发明提出的技术方案为:
一种语音识别方法,该方法包括:
客户端判断当前的语音识别应用是否涉及隐私,如果是,则由客户端对采集到的语音信号进行语音识别;否则,由服务器对采集到的语音信号进行语音识别。
当客户端判断出当前的语音识别应用不涉及隐私时,该方法进一步包括:判断与服务器是否成功建立连接,如果成功建立连接,由服务器对采集到的语音信号进行语音识别;否则,由客户端对采集到的语音信号进行语音识别。
所述由客户端对采集到的语音信号进行语音识别包括:
客户端提取所述语音信号中的语音识别特征,根据语音识别模型对提取到的语音识别特征进行语音识别;
客户端根据语音识别后得到的识别结果对所述语音识别模型进行更新,得到更新后的语音识别模型;
客户端根据更新后的语音识别模型对识别结果进行语音识别,得到更新的识别结果。
该方法进一步包括:客户端重复执行根据更新的识别结果更新语音识别模型、根据更新的语音识别模型更新识别结果,直至更新后的自身语音识别模型相比更新前的自身语音识别模型的变化小于某个阈值。
所述由服务器对采集到的语音信号进行语音识别包括:
服务器提取语音信号中的语音识别特征,根据自身语音识别模型对语音识别特征进行语音识别;
服务器根据得到的识别结果更新自身语音识别模型;
根据更新的自身语音识别模型对识别结果进行语音识别,得到更新的识别结果;
将所述更新的语音识别结果返回给客户端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三星通信技术研究有限公司;三星电子株式会社,未经北京三星通信技术研究有限公司;三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210048232.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于旋转机械的翼型
- 下一篇:一种包膜氧化铁黑颗粒的制备方法