[发明专利]辨识音频片段的方法及其装置在审
| 申请号: | 201610649485.6 | 申请日: | 2016-08-10 |
| 公开(公告)号: | CN107731244A | 公开(公告)日: | 2018-02-23 |
| 发明(设计)人: | 雷永安;雷兆恒;余泳峰 | 申请(专利权)人: | 天迈科技有限公司 |
| 主分类号: | G10L25/51 | 分类号: | G10L25/51 |
| 代理公司: | 北京律诚同业知识产权代理有限公司11006 | 代理人: | 黄韧敏,朱远平 |
| 地址: | 中国香港九龙湾宏开道2*** | 国省代码: | 香港;81 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 辨识 音频 片段 方法 及其 装置 | ||
1.一种辨识音频片段的方法,其特征在于,所述方法包括如下步骤:
A、采集欲辨识的音频片段中达到预设时序序列长度的至少一条第一山脊线;
B、在将采集到的所述第一山脊线与预存的至少一条第二山脊线比对一致后,辨识出所述音频片段;
所述第一山脊线和第二山脊线均是由时间时序和音频频率组成的时间-音频坐标中,每个时序序列对应的多个音频频率中到达预设的音量阈值的点连线构成。
2.根据权利要求1所述的方法,其特征在于,在所述时间-音频坐标中,所述时间为横坐标,所述音频频率为纵坐标;所述步骤A包括:
A1、采集所述欲辨识的音频片段中在预设音频频率范围及预设的时间段内的达预设的音量阈值的点,并根据预设的山脊点设置规制,在所述达预设的音量阈值的点中选择满足所述预设的山脊点设置规制的点作为山脊点;
A2在所述时间-音频坐标中将除纵向方向上之外的相邻的所述山脊点连接成第三山脊线;
A3、在所述第三山脊线包括多条时,选择其中达到预设时序序列长度的所述第一山脊线。
3.根据权利要求2所述的方法,其特征在于,所述步骤B包括:
B1、在将采集到的所述第一山脊线与预存的至少一条第二山脊线进行比对,在对比一致后,确认所述欲辨识的音频片段是所述第二山脊线所代表的音频信息;
B2、在将采集到的所述第一山脊线与预存的至少一条第二山脊线进行比对,在对比不一致时,辨识所述音频片段失败。
4.根据权利要求2所述的方法,其特征在于,所述步骤A1包括:
A11、采集欲辨识的音频片段中于所述预设的时间段内的每个时序序列所对应的所有所述预设音频频率范围内每个音频频率下的第一音量值,并选择其中达到所述预设的音量阈值的第二音量值;
A12、在每个所述时序序列所对应的所述第二音量值包括多个时,并且多个所述第二音量值在所述时间-音频坐标的纵向上所处位置相邻,选择多个所述第二音量值中最大的音量值;并将所述最大的音量值在所述时间-音频坐标中所对应的位置点设置为山脊点;和/或
A13、在每个所述时序序列所对应的所述第二音量值包括多个时,并且多个所述第二音量值在所述时间-音频坐标的纵向上所处位置均不相邻,将多个所述第二音量值在所述时间-音频坐标中所对应的位置点均设置为山脊点;和/或
A14、在每个所述时序序列所对应的所述第二音量值包括多个时,并且多个所述第二音量值在所述时间-音频坐标的纵向上所处位置包括几组相邻的所述第二音量值时,选择每组所述相邻的第二音量值中最大的音量值在所述时间-音频坐标中所对应的位置点设置为山脊点。
5.根据权利要求2所述的方法,其特征在于,在所述第三山脊线包括多条时,多条所述第三山脊线交叉或者并行。
6.根据权利要求1所述的方法,其特征在于,所述预设时序序列长度为9;
所述预设的音量阈值为大于等于70分贝;
所述预设音频频率范围小于等于20000HZ;
所述第二山脊线的长度等于或者大于所述第一山脊线;
所述比对一致为在相同的时序序列和音频频率下所述第一山脊线全长与第二山脊线线条的前部、中段、后部或者全部轨迹吻合。
7.根据权利要求1所述的方法,其特征在于,所述辨识音频片段的方法通过一移动通信终端或者固定通信终端实现。
8.根据权利要求7所述的方法,其特征在于,所述移动通信终端或者固定通信终端均包括:
麦克风,所述麦克风采集所述至少一条第一山脊线;
储存体,所述储存体存储所述至少一条第二山脊线;
处理器,所述处理器将所述第一山脊线与预存的所述至少一条第二山脊线比对一致后,辨识出所述音频片段;
网络联机模块,所述网络联机模块在互联网或者是服务器上查找所述预存的至少一条第二山脊线。
9.一种辨识音频片段的装置,其特征在于,所述装置包括如下步骤:
采集模块,用于采集欲辨识的音频片段中达到预设时序序列长度的至少一条第一山脊线;
辨识模块,用于在将采集到的所述第一山脊线与预存的至少一条第二山脊线比对一致后,辨识出所述音频片段;
所述第一山脊线和第二山脊线均是由时间时序和音频频率组成的时间-音频坐标中,每个时序序列对应的多个音频频率中到达预设的音量阈值的点连线构成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天迈科技有限公司,未经天迈科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610649485.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于间距倍增的集成电路制造
- 下一篇:一种硅片晶圆激光切割工艺





