[发明专利]语音识别方法、装置及系统在审
申请号: | 201711147698.X | 申请日: | 2017-11-17 |
公开(公告)号: | CN109817220A | 公开(公告)日: | 2019-05-28 |
发明(设计)人: | 牛也;徐巍越;冯伟国;黄光远 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L15/30 | 分类号: | G10L15/30;G10L15/22;G10L15/26;G10L15/00 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 刘戈 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音识别 方言 服务器发送 装置及系统 语音信号 唤醒 语音 请求服务器 服务请求 服务器 自动化 申请 | ||
本申请实施例提供一种语音识别方法、装置及系统。其中,方法包括:接收语音唤醒词;识别语音唤醒词所属的第一方言;向服务器发送服务请求,以请求服务器从不同方言对应的ASR模型中选择第一方言对应的ASR模型;向服务器发送待识别语音信号,以供服务器利用第一方言对应的ASR模型对待识别语音信号进行语音识别。本实施例提供的方法可以自动化地对多方言进行语音识别,提高针对多方言进行语音识别的效率。
技术领域
本申请涉及语音识别技术领域,尤其涉及一种语音识别方法、装置及系统。
背景技术
自动语音识别(Automatic Speech Recognition,ASR)是一种可以把人类的语音音频信号转换为文本内容的技术。随着软硬件技术的发展,各种智能设备的计算能力和存储容量有了很大进步,使得语音识别技术在智能设备中得以广泛应用。
在语音识别技术中,需要准确识别语音音素,基于准确识别的语音音素才能转换为文本。但是,不论是哪种语言,都会因为各种因素导致该语言有多种不同的发音,即多方言。以汉语为例,有官话方言、晋语、湘语、赣语、吴语、闽语、粤语、客语等多种方言,不同方言的发音差异较大。
目前,针对方言的语音识别方案尚不成熟,有待针对多方言问题提供一种解决方案。
发明内容
本申请的多个方面提供一种语音识别方法、装置及系统,用以自动化地对多方言进行语音识别,提高针对多方言进行语音识别的效率。
本申请实施例提供一种语音识别方法,适用于终端设备,该方法包括:
接收语音唤醒词;
识别所述语音唤醒词所属的第一方言;
向服务器发送服务请求,以请求所述服务器从不同方言对应的ASR模型中选择所述第一方言对应的ASR模型;
向所述服务器发送待识别语音信号,以供所述服务器利用所述第一方言对应的ASR模型对所述待识别语音信号进行语音识别。
本申请实施例还提供一种语音识别方法,适用于服务器,该方法包括:
接收终端设备发送的服务请求,所述服务请求指示选择第一方言对应的ASR模型;
从不同方言对应的ASR模型中,选择所述第一方言对应的ASR模型,所述第一方言是所述语音唤醒词所属的方言;
接收所述终端设备发送的待识别语音信号,并利用所述第一方言对应的ASR模型对所述待识别语音信号进行语音识别。
本申请实施例还提供一种语音识别方法,适用于终端设备,该方法包括:
接收语音唤醒词;
向服务器发送所述语音唤醒词,以供服务器基于所述语音唤醒词从不同方言对应的ASR模型中选择所述语音唤醒词所属第一方言对应的ASR模型;
向所述服务器发送待识别语音信号,以供所述服务器利用所述第一方言对应的ASR模型对所述待识别语音信号进行语音识别。
本申请实施例还提供一种语音识别方法,适用于服务器,该方法包括:
接收终端设备发送的语音唤醒词;
识别所述语音唤醒词所属的第一方言;
从不同方言对应的ASR模型中,选择所述第一方言对应的ASR模型;
接收所述终端设备发送的待识别语音信号,并利用所述第一方言对应的ASR模型对所述待识别语音信号进行语音识别。
本申请实施例还提供一种语音识别方法,包括:
接收语音唤醒词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711147698.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音唤醒测试方法及系统
- 下一篇:多人视频方法、装置、设备及存储介质