[发明专利]语音控制方法、装置、电子设备及存储介质在审
申请号: | 202110997178.8 | 申请日: | 2021-08-27 |
公开(公告)号: | CN113436629A | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 聂帅;陶建华;梁山;易江燕;傅睿博 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/14;G10L15/06 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 孙剑锋;李永叶 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 控制 方法 装置 电子设备 存储 介质 | ||
本申请涉及一种语音控制方法、装置、电子设备及存储介质,所述语音控制方法,包括以下步骤:获取已知唤醒词的音节;确定与所述唤醒词对应的非唤醒词的音节;根据所述唤醒词的音节、所述非唤醒词的音节和预设的垃圾词信息构建唤醒词解码网络,以根据所述唤醒词解码网络对输入的语音进行解码,并根据解码结果确定是否执行唤醒操作,本申请在解码网络中引入非唤醒词的音节从而统一描述非唤醒词,能够降低非唤醒词引起的误唤醒率。
技术领域
本申请涉及语音识别领域,尤其涉及一种语音控制方法、装置、电子设备及存储介质。
背景技术
语音是人与机器之间最自然的交互方式之一。在物联网时代,语音交互被普遍视为最有可能成为下一代信息、内容以及服务的核心入口之一。目前,语音交互已在通讯、智能家居、车载、智能机器人等领域得到广泛的应用,特别是近几年,以智能音箱为代表的语音交互产品在国内外的火爆,极大地激发了语音交互技术的应用和发展,可以说语音交互的时代即将到来。
语音唤醒作为交互设备的名称,起到唤醒设备启动后续语音交互进程的作用,对提升交互体验和控制设备功耗具有不可替代的重要作用,是语音交互的核心模块之一。语音唤醒是语音交互设备的入口,需要一直运行,随时响应用户的请求。既要求语音唤醒模块能够准确而灵敏地响应用户的请求,也要求其尽量避免误唤醒。在保证唤醒率不降低的前提下,尽可能地降低误唤醒是语音唤醒领域致力于追求的目标。
最为经典的语音唤醒技术是基于HMM-Filler解码方案,由声学模型和解码器构成。声学模型计算输入语音的状态后验概率,解码器利用后验概率计算解码路径的得分。最后设计决策器根据解码得分决定是否唤醒。在解码路径构建中,垃圾路径是吸收非唤醒声音的主要途径,对误唤醒的控制至关重要。传统的垃圾路径笼统的用两个状态表示,如图1所示,“SIL”是静音和非语音状态状态,“G”是非唤醒词的语音状态。这条垃圾路径能够吸收绝大部分非唤醒声音的得分,特别是对非语音的噪声和干扰,但与唤醒词相近的语音比较容易引起误唤醒,比如对于唤醒词“小度小度”,同样四个字的相近词,比如“小猫小狗”等可能容易引起误唤醒。为了缓解这种情况引起的误唤醒,一个有效的手段是找到引起误唤醒的路径,然后将其加入到解码路径中,但这种方案实施起来非常繁琐,需要通过误唤醒测试找到所有容易引起误唤醒的路径,然后将他们依次加入解码路径中。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请的实施例提供了一种语音控制方法、装置、电子设备及存储介质。
第一方面,本申请的实施例提供了一种语音控制方法,包括以下步骤:
获取已知唤醒词的音节;
确定与所述唤醒词对应的非唤醒词的音节;
根据所述唤醒词的音节、所述非唤醒词的音节和预设的垃圾词信息构建唤醒词解码网络,以根据所述唤醒词解码网络对输入的语音进行解码,并根据解码结果确定是否执行唤醒操作。
优选地,所述确定与所述唤醒词对应的非唤醒词的音节,包括:
按照预设的拼读方法,将唤醒词的音节分为多个音节组成;
确定与唤醒词的音节组成对应的非唤醒词的音节组成,其中,所述非唤醒词的音节组成为不是唤醒词的当前音节组成且属于当前音节组成所属类型的所有音节组成的集合;
按照唤醒词的音节的拼合顺序,将所述非唤醒词的音节组成拼合为非唤醒词的音节。
优选地,所述音节组成所属类型包括声母和韵母,所述确定与唤醒词的音节组成对应的非唤醒词的音节组成,包括:
对于唤醒词的音节中的声母,确定不是当前声母的所有声母的集合作为与所述唤醒词对应的非唤醒词的音节组成;
对于唤醒词的音节中的韵母,确定不是当前韵母的所有韵母的集合作为与所述唤醒词对应的非唤醒词的音节组成,其中,所述韵母上标注声调。
优选地,所述根据所述唤醒词解码网络对输入的语音进行解码,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110997178.8/2.html,转载请声明来源钻瓜专利网。