[发明专利]语音识别方法及智能家居系统、会议设备、计算设备在审
| 申请号: | 202010129820.6 | 申请日: | 2020-02-28 |
| 公开(公告)号: | CN113409793A | 公开(公告)日: | 2021-09-17 |
| 发明(设计)人: | 郑斯奇;雷赟 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/18;G10L17/22;G06N3/08;G06N20/00 |
| 代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 张文华 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 识别 方法 智能家居 系统 会议设备 计算 设备 | ||
本申请公开了一种语音识别方法及智能家居系统、会议设备、计算设备。其中,该方法包括:采集至少一个目标对象的语音信息;将至少一个目标对象的语音信息输入至第一机器学习模型和第二机器学习模型,并将第一机器学习模型和第二机器学习模型中每个网络层的输出结果共同输入至目标机器学习模型进行分析,得到目标对象的身份信息和与身份信息对应的语音内容;输出语音内容。本申请解决了与短时文本无关任务对应的语音识别方案准确率较低的技术问题。
技术领域
本申请涉及语音识别领域,具体而言,涉及一种语音识别方法及智能家居系统、会议设备、计算设备。
背景技术
说话人识别技术是一种通过声音识别说话人的身份的技术。目前说话人识别技术在工业界的落地应用,主要都是短时文本相关场景,即固定说话人所说的文本内容,如智能家居的唤醒词;或是长时文本无关,即不规定说话人所说内容,但是对说话时长要求比较长。对于短时文本无关任务,利用传统说话人识别技术进行语音识别,识别准确率较低,无法达到商用级别。
针对现阶段与短时文本无关任务对应的语音识别方案准确率较低的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种语音识别方法及智能家居系统、会议设备、计算设备,以至少解决与短时文本无关任务对应的语音识别方案准确率较低的技术问题。
根据本申请实施例的一个方面,提供了一种语音识别方法,包括:采集至少一个目标对象的语音信息;将至少一个目标对象的语音信息输入至第一机器学习模型和第二机器学习模型,并将第一机器学习模型和第二机器学习模型中每个网络层的输出结果共同输入至目标机器学习模型中的相应网络层进行分析,得到目标对象的身份信息和与身份信息对应的语音内容;输出语音内容。
根据本申请实施例的另一方面,还提供了另一种语音识别方法,包括:接收目标对象的语音信息;将目标对象的语音信息输入至目标机器学习模型的相应网络层进行分析,得到目标对象的身份信息以及与身份信息对应的语音内容,其中,目标机器学习模型中每个网络层的输入为第一机器学习模型和第二机器学习模型中与每个网络层的输出结果;对身份信息进行验证,并在验证通过时,执行与语音内容对应的操作。
根据本申请实施例的另一方面,还提供了一种智能家居系统,包括至少一个家电设备和控制设备,其中,至少一个家电设备,用于采集至少一个家电设备所在空间内目标对象的语音信息,以及接收来自控制设备的控制指令;控制设备,用于接收语音信息,并将至少一个目标对象的语音信息输入至第一机器学习模型和第二机器学习模型,并将第一机器学习模型和第二机器学习模型中每个网络层的输出结果共同输入至目标机器学习模型的相应网络层进行分析,得到目标对象的身份信息和与身份信息对应的语音内容;基于语音内容生成控制指令,并将控制指令发送至至少一个家电设备。
根据本申请实施例的另一方面,还提供了一种会议设备,包括:至少一个语音采集设备,用于采集至少一个语音采集设备所在空间内的至少一个目标对象的语音信息;控制器,用于获取语音信息,并将语音信息输入至第一机器学习模型,并将第一机器学习模型中每个网络层的输出结果输入至目标机器学习模型中的相应网络层,其中,目标机器学习模型用于识别目标对象的身份信息和与身份信息对应的语音内容,第一机器学习模型为对至少一个目标对象的声学特征进行识别的模型。
根据本申请实施例的另一方面,还提供了另一种会议设备,包括:至少一个语音采集设备,用于采集至少一个语音采集设备所在空间内的至少一个目标对象的语音信息;控制器,用于获取语音信息,并将语音信息输入至第二机器学习模型,并将第二机器学习模型中每个网络层的输出结果输入至目标机器学习模型中的相应网络层,其中,目标机器学习模型用于识别目标对象的身份信息和与身份信息对应的语音内容,第二机器学习模型为对至少一个目标对象的语音信息进行内容识别的模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010129820.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能阀门电动执行机构的控制系统构建方法
- 下一篇:无线扩音系统及终端





