[发明专利]关键词检测方法、装置、计算机设备及存储介质有效
申请号: | 202210234073.1 | 申请日: | 2022-03-10 |
公开(公告)号: | CN114817456B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 杨斌;吴海英;王洪斌;刘敏;蒋宁 | 申请(专利权)人: | 马上消费金融股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/30;G06F18/214 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨泽;刘芳 |
地址: | 404100 重庆市渝北区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键词 检测 方法 装置 计算机 设备 存储 介质 | ||
1.一种关键词检测方法,其特征在于,所述方法包括:
获取待检测音频;
提取所述待检测音频的第一音频特征,得到所述第一音频特征构成的第一特征序列;
将预设关键词特征与所述第一特征序列拼接,得到第二特征序列,所述预设关键词特征为预设关键词对应的第二音频特征;
将所述第二特征序列输入至预先训练的关键词检测模型中,得到所述待检测音频的关键词检测结果,所述关键词检测模型用于从所述第二特征序列中筛选出与所述预设关键词特征相关联的第一音频特征,并基于所述相关联的第一音频特征检测所述待检测音频,得到所述关键词检测结果。
2.根据权利要求1所述的方法,其特征在于,在所述将所述第二特征序列输入至预先训练的关键词检测模型中,得到所述待检测音频的关键词检测结果之前,所述方法还包括:
对所述第二特征序列中的每个音频特征添加位置特征,得到第三特征序列;
所述将所述第二特征序列输入至预先训练的关键词检测模型中,得到所述待检测音频的关键词检测结果,包括:
将所述第三特征序列输入至所述关键词检测模型,得到所述待检测音频的关键词检测结果。
3.根据权利要求2所述的方法,其特征在于,所述关键词检测模型包括编码器、激活函数以及概率判别模块,
所述编码器用于利用注意力机制,根据所述每个音频特征的位置特征,获取所述第三特征序列中每个第一音频特征与所述预设关键词特征的关联度分数,将所述关联度分数达到预设分数阈值的第一音频特征与所述预设关键词特征拼接,得到高维特征;
所述激活函数用于对所述高维特征中的第一音频特征进行归一化处理,得到目标概率,所述目标概率用于表征所述高维特征中的第一音频特征所对应的音频中,包含所述预设关键词的概率;
所述概率判别模块用于基于所述目标概率以及预设概率阈值,确定所述待检测音频的关键词检测结果。
4.根据权利要求3所述的方法,其特征在于,若所述目标概率的数量为多个,所述基于所述目标概率以及预设概率阈值,确定所述待检测音频的关键词检测结果,包括:
将概率值最大的所述目标概率确定为最大目标概率;
若所述最大目标概率大于或等于所述预设概率阈值,则确定所述待检测音频中包含所述预设关键词,否则,确定所述待检测音频中未包含所述预设关键词。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述提取所述待检测音频的第一音频特征,得到所述第一音频特征构成的第一特征序列,包括:
若所述待检测音频的时长不大于时长阈值,则提取所述待检测音频的第一音频特征,得到所述第一音频特征构成的第一特征序列;
若所述待检测音频的时长大于所述时长阈值,则将所述待检测音频切分为多个子音频,并提取所述多个子音频中每个子音频的第一音频特征对应构成的第一特征序列,得到多个第一特征序列。
6.根据权利要求5所述的方法,其特征在于,若第一特征序列为多个,所述将预设关键词特征与所述第一特征序列拼接,得到第二特征序列,包括:
将所述预设关键词特征与所述多个第一特征序列中的每个第一特征序列拼接,得到多个第二特征序列;
所述将所述第二特征序列输入至预先训练的关键词检测模型中,得到所述待检测音频的关键词检测结果,包括:
将所述多个第二特征序列输入至预先训练的关键词检测模型中,得到多个子检测结果;
基于所述多个子检测结果,确定所述待检测音频的关键词检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马上消费金融股份有限公司,未经马上消费金融股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210234073.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:非晶态合金光热催化剂及其制备方法和应用
- 下一篇:一种监控录像加密网关