[发明专利]优化关键词检索系统在审
申请号: | 201910783303.8 | 申请日: | 2019-08-23 |
公开(公告)号: | CN112420026A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 田垚;肖雨佳;E·C·林;何磊;朱辉 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/26;G06F16/332;G06F16/35 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 张海燕 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 优化 关键词 检索系统 | ||
本公开提供了用于优化关键词检索系统的方法和装置。可以生成包含给定关键词的话语文本集合。可以合成与所述话语文本集合相对应的语音信号集合。可以利用所述语音信号集合中的至少一部分语音信号以及所述话语文本集合中与所述至少一部分语音信号相对应的话语文本来优化所述关键词检索系统中的声学模型。
背景技术
语音识别可以用于从输入的语音信号中识别出与其相对应的文本序列。基于语音的关键词检索(KWS:keyword spotting)或关键词识别是语音识别的子任务。关键词检索不需要从语音信号中检索或识别出每个词语,而是仅需要从该语音信号中检索或识别出给定关键词。
发明内容
提供本发明内容以便介绍一组概念,这组概念将在以下的具体实施方式中做进一步描述。本发明内容并非旨在标识所保护主题的关键特征或必要特征,也不旨在用于限制所保护主题的范围。
本公开的实施例提供了用于优化关键词检索系统的方法和装置。可以生成包含给定关键词的话语文本集合。可以合成与所述话语文本集合相对应的语音信号集合。可以利用所述语音信号集合中的至少一部分语音信号以及所述话语文本集合中与所述至少一部分语音信号相对应的话语文本来优化所述关键词检索系统中的声学模型。
应当注意,以上一个或多个方面包括以下详细描述以及权利要求中具体指出的特征。下面的说明书及附图详细提出了所述一个或多个方面的某些说明性特征。这些特征仅仅指示可以实施各个方面的原理的多种方式,并且本公开旨在包括所有这些方面和其等同变换。
附图说明
以下将结合附图描述所公开的多个方面,这些附图被提供用以说明而非限制所公开的多个方面。
图1示出了根据实施例的示例性关键词检索系统。
图2示出了根据实施例的声学特征提取的示例性过程。
图3示出了根据实施例的示例性声学模型。
图4示出了根据实施例的对声学模型进行优化的示例性过程。
图5示出了根据实施例的生成优化数据的示例性过程。
图6示出了根据实施例的生成话语文本集合的示例性过程。
图7示出了根据实施例的生成话语文本集合的另一示例性过程。
图8示出了根据实施例的针对给定关键词的示例性解码网络。
图9示出了根据实施例的示例性解码过程。
图10示出了根据实施例的针对示例性给定关键词的解码输出。
图11示出了根据实施例的用于优化关键词检索系统的示例性方法的流程图。
图12示出了根据实施例的用于优化关键词检索系统的示例性装置。
图13示出了根据实施例的用于优化关键词检索系统的示例性装置。
具体实施方式
现在将参考多种示例性实施方式来讨论本公开。应当理解,这些实施方式的讨论仅仅用于使得本领域技术人员能够更好地理解并从而实施本公开的实施例,而并非教导对本公开的范围的任何限制。
基于语音的针对给定关键词的检索可以被应用于诸如设备唤醒、命令控制、语音搜索等领域。设备唤醒是指将设备从休眠状态激活至运行状态。用于唤醒设备的关键词可以是由例如设备商指定的关键词,例如,“你好小娜”、“你好小冰”等。命令控制是指在检测到特定命令后执行与该特定命令对应的控制操作。用于命令控制的关键词可以是含有特定动作的词组,例如,“关闭手机”、“打开音乐播放器”等。语音搜索是指从采集的大量语音信号中搜索给定关键词。例如,该给定关键词可以是敏感词语、商标名称等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910783303.8/2.html,转载请声明来源钻瓜专利网。