[发明专利]关键词确认方法和装置有效
申请号: | 201711294885.0 | 申请日: | 2017-12-08 |
公开(公告)号: | CN109903751B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 刘勇;姚海涛 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08 |
代理公司: | 北京君以信知识产权代理有限公司 11789 | 代理人: | 谭镇 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键词 确认 方法 装置 | ||
1.一种关键词确认方法,其特征在于,包括:
获取第一音频数据,所述第一音频数据被识别为关键词;
确定与所述第一音频数据时间上连续的第二音频数据中存在多个连续的静音片段;其中,所述第二音频数据包括位于所述第一音频数据之前的音频数据和/或位于所述第一音频数据之后的音频数据;
确认所述第一音频数据为有效关键词。
2.根据权利要求1所述的方法,其特征在于,所述确定与所述第一音频数据时间上连续的第二音频数据中存在多个连续的静音片段的步骤包括:
确定所述片段的发音相似概率,所述发音相似概率为所述片段与多个发音单元之间的最大相似概率;
确定所述片段的静音概率,所述静音概率为所述片段与静音单元的相似概率;
当所述发音相似概率与所述静音概率的关系满足预设条件时,确定所述片段为静音片段;
根据所确定的静音片段,确定所述第二音频数据中存在多个连续的所述静音片段。
3.根据权利要求1所述的方法,其特征在于,所述确定所述第二音频数据的至少一个片段是否为静音片段的步骤包括:
确定所述片段的发音相似概率,所述发音相似概率为所述片段与多个发音单元之间的最大相似概率;
确定所述片段的静音概率,所述静音概率为所述最大相似概率对应的发音单元与静音单元的相似概率;
当所述发音相似概率与所述静音概率的关系满足预设条件时,确定所述片段为静音片段;
根据所确定的静音片段,确定所述第二音频数据中存在多个连续的所述静音片段。
4.根据权利要求2或3所述的方法,其特征在于,所述确定所述第二音频数据中存在多个连续的所述静音片段的步骤包括:
确定所述第二音频数据中存在三个以上连续的静音片段。
5.根据权利要求2或3所述的方法,其特征在于,所述预设条件包括:
所述片段的发音相似概率与静音概率的差值的绝对值小于第一阈值。
6.根据权利要求1所述的方法,其特征在于,所述获取第一音频数据的步骤之前,所述方法还包括:
检测所采集到的音频数据中是否包括关键词。
7.根据权利要求6所述的方法,其特征在于,所述关键词具有属性信息,所述确认所述第一音频数据为有效关键词的步骤包括:
当所述关键词的属性信息为主关键词时,且所述关键词之前的第二音频数据为静音时,确认所述关键词为有效主关键词。
8.根据权利要求6所述的方法,其特征在于,所述关键词具有属性信息,所述确认所述第一音频数据为有效关键词的步骤包括:
当所述关键词的属性信息为副关键词时,且所述关键词之前和之后的第二音频数据均为静音时,确认所述关键词为有效副关键词。
9.一种关键词确认方法,其特征在于,包括:
获取第一音频数据,所述第一音频数据被识别为关键词;
确定与所述第一音频数据时间上连续的第二音频数据的多个片段的累积静音概率;其中,所述第二音频数据包括位于所述第一音频数据之前的音频数据和/或位于所述第一音频数据之后的音频数据;
确定所述第一音频数据的多个片段的累积关键词概率;
当所述累积静音概率与累积关键词概率的关系满足第二预设条件时,确认所述第一音频数据为有效关键词。
10.根据权利要求9所述的方法,其特征在于,所述第二预设条件包括:
所述累积静音概率与累积关键词概率比值的绝对值大于第二阈值。
11.根据权利要求9所述的方法,其特征在于,所述获取第一音频数据的步骤之前,所述方法还包括:
检测所采集到的音频数据中是否包括关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711294885.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音识别方法及装置
- 下一篇:对齐语音的方法和装置