[发明专利]跟唱识别方法、装置、存储介质及电子设备有效
| 申请号: | 201910509447.4 | 申请日: | 2019-06-13 |
| 公开(公告)号: | CN110232911B | 公开(公告)日: | 2022-04-05 |
| 发明(设计)人: | 丁匡正 | 申请(专利权)人: | 南京地平线集成电路有限公司 |
| 主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/01;G10L15/25 |
| 代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
| 地址: | 210000 江苏省南京市栖霞区*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 识别 方法 装置 存储 介质 电子设备 | ||
1.一种跟唱识别方法,包括:
获取当前播放的音频的第一节奏信息;
确定用于表征目标对象的唇部动作的唇部动作特征;
基于所述唇部动作特征,确定所述唇部动作特征对应的第二节奏信息;
将所述第一节奏信息和所述第二节奏信息进行匹配,得到节奏匹配度;
若所述节奏匹配度满足第一预设条件,确定所述目标对象处于跟唱状态;
所述基于所述唇部动作特征,确定所述唇部动作特征对应的第二节奏信息,包括:
基于所述唇部动作特征,确定第一语句时间集合作为第二节奏信息,其中,所述第一语句时间集合中的语句时间用于表征所述目标对象发出的语句的持续时间;
所述获取当前播放的音频的第一节奏信息,包括:
对所述音频进行节奏识别,得到第一节奏信息,其中,所述第一节奏信息包括第二语句时间集合,所述第二语句时间集合中的语句时间用于表征所述音频包括的语句的持续时间。
2.根据权利要求1所述的方法,其中,所述方法还包括:
若所述节奏匹配度满足第二预设条件,获取用于表征所述目标对象发出的声音的语音信号;
对所述语音信号进行识别,得到识别文本;
获取所述音频对应的播放文本,并将所述识别文本与所述播放文本进行匹配,得到文本匹配度;
若所述文本匹配度满足第三预设条件,确定所述目标对象处于跟唱状态。
3.根据权利要求2所述的方法,其中,所述对所述语音信号进行识别,得到识别文本,包括:
对所述语音信号进行识别,得到第一识别结果;
对所述唇部动作特征进行识别,得到第二识别结果;
基于所述第一识别结果和第二识别结果,确定所述识别文本。
4.根据权利要求1所述的方法,其中,所述获取当前播放的音频的第一节奏信息,包括:
获取当前播放的音频的属性信息,从所述属性信息中确定第一节奏信息。
5.根据权利要求1-4之一所述的方法,其中,所述方法还包括:
响应于确定所述目标对象处于跟唱状态,获取所述当前播放的音频的相关信息;
基于所述相关信息为所述目标对象推荐内容。
6.一种跟唱识别装置,包括:
第一获取模块,用于获取当前播放的音频的第一节奏信息;
第一确定模块,用于确定用于表征目标对象的唇部动作的唇部动作特征;
第二确定模块,用于基于所述唇部动作特征,确定所述唇部动作特征对应的第二节奏信息;
匹配模块,用于将所述第一节奏信息和所述第二节奏信息进行匹配,得到节奏匹配度;
第三确定模块,用于若所述节奏匹配度满足第一预设条件,确定所述目标对象处于跟唱状态;
所述第二确定模块进一步用于:基于所述唇部动作特征,确定第一语句时间集合作为第二节奏信息,其中,所述第一语句时间集合中的语句时间用于表征所述目标对象发出的语句的持续时间;
所述第一获取模块进一步用于:对所述音频进行节奏识别,得到第一节奏信息,其中,所述第一节奏信息包括第二语句时间集合,所述第二语句时间集合中的语句时间用于表征所述音频包括的语句的持续时间。
7.根据权利要求6所述的装置,其中,所述装置还包括:
第二获取模块,用于若所述节奏匹配度满足第二预设条件,获取用于表征所述目标对象发出的声音的语音信号;
识别模块,用于对所述语音信号进行识别,得到识别文本;
第三获取模块,用于获取所述音频对应的播放文本,并将所述识别文本与所述播放文本进行匹配,得到文本匹配度;
第四确定模块,用于若所述文本匹配度满足第三预设条件,确定所述目标对象处于跟唱状态。
8.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-5任一所述的跟唱识别方法。
9.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-5任一所述的跟唱识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京地平线集成电路有限公司,未经南京地平线集成电路有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910509447.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于车辆中的语音检测的方言与语言识别
- 下一篇:语音识别仲裁逻辑





