[发明专利]语音识别方法、装置及系统在审

申请号：	201711147698.X	申请日：	2017-11-17
公开（公告）号：	CN109817220A	公开（公告）日：	2019-05-28
发明（设计）人：	牛也;徐巍越;冯伟国;黄光远	申请（专利权）人：	阿里巴巴集团控股有限公司
主分类号：	G10L15/30	分类号：	G10L15/30;G10L15/22;G10L15/26;G10L15/00
代理公司：	北京太合九思知识产权代理有限公司 11610	代理人：	刘戈
地址：	英属开曼群岛大开***	国省代码：	开曼群岛;KY
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别方言服务器发送装置及系统语音信号唤醒语音请求服务器服务请求服务器自动化申请
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例提供一种语音识别方法、装置及系统。其中，方法包括：接收语音唤醒词；识别语音唤醒词所属的第一方言；向服务器发送服务请求，以请求服务器从不同方言对应的ASR模型中选择第一方言对应的ASR模型；向服务器发送待识别语音信号，以供服务器利用第一方言对应的ASR模型对待识别语音信号进行语音识别。本实施例提供的方法可以自动化地对多方言进行语音识别，提高针对多方言进行语音识别的效率。

技术领域

本申请涉及语音识别技术领域，尤其涉及一种语音识别方法、装置及系统。

背景技术

自动语音识别(Automatic Speech Recognition，ASR)是一种可以把人类的语音音频信号转换为文本内容的技术。随着软硬件技术的发展，各种智能设备的计算能力和存储容量有了很大进步，使得语音识别技术在智能设备中得以广泛应用。

在语音识别技术中，需要准确识别语音音素，基于准确识别的语音音素才能转换为文本。但是，不论是哪种语言，都会因为各种因素导致该语言有多种不同的发音，即多方言。以汉语为例，有官话方言、晋语、湘语、赣语、吴语、闽语、粤语、客语等多种方言，不同方言的发音差异较大。

目前，针对方言的语音识别方案尚不成熟，有待针对多方言问题提供一种解决方案。

发明内容

本申请的多个方面提供一种语音识别方法、装置及系统，用以自动化地对多方言进行语音识别，提高针对多方言进行语音识别的效率。

本申请实施例提供一种语音识别方法，适用于终端设备，该方法包括：

接收语音唤醒词；

识别所述语音唤醒词所属的第一方言；

向服务器发送服务请求，以请求所述服务器从不同方言对应的ASR模型中选择所述第一方言对应的ASR模型；