[发明专利]文件属性识别方法及装置有效
申请号: | 201711274772.4 | 申请日: | 2017-12-06 |
公开(公告)号: | CN107862093B | 公开(公告)日: | 2020-06-30 |
发明(设计)人: | 劳振锋 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G06F16/432 | 分类号: | G06F16/432;G10L25/06;G10L25/51 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 郭晶 |
地址: | 510660 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件属性 识别 方法 装置 | ||
本发明公开了一种文件属性识别方法及装置,属于网络技术领域。所述方法包括:获取待识别的多媒体文件,多媒体文件包括人声音轨音频和伴奏音轨音频;获取人声音轨音频中的第一音频片段以及伴奏音轨音频中的第二音频片段;获取第一音频片段与第二音频片段之间的归一相关函数;基于归一相关函数的第一峰值,识别多媒体文件的属性,第一峰值是指归一相关函数的最大幅值,属性为真唱文件或假唱文件。本发明保证电子设备可以实现识别和区分假唱文件和真唱文件的功能,提高了电子设备的智能性。
技术领域
本发明涉及网络技术领域,特别涉及一种文件属性识别方法及装置。
背景技术
随着网络在人们日常生活中的作用越来越大,人们可以录制多媒体文件,将多媒体文件上传至网络,通过彼此的多媒体文件进行在线比赛。例如录制歌曲来进行K歌比赛,录制小视频来进行小视频比赛等。
用户上传的多媒体文件可能并非自己演唱的真唱文件,而为录制或合成的假唱文件:例如,在K歌比赛中,某些用户可能会播放原唱或者他人演唱的歌曲,将这种假唱歌曲冒充为自己演唱的真唱歌曲,通过终端录制歌曲,终端会将假唱歌曲上传给服务器,服务器会将假唱歌曲发布至网络,则假唱歌曲也会参与至在线比赛中。
在实现本发明的过程中,发明人发现相关技术至少存在以下问题:
目前终端或服务器无法识别上传的多媒体文件为假唱文件还是真唱文件,智能性差。
发明内容
本发明实施例提供了一种文件属性识别方法及装置,能够解决相关技术中无法识别上传的多媒体文件为假唱文件还是真唱文件问题,所述技术方案如下:
第一方面,提供了一种文件属性识别方法,所述方法包括:
获取待识别的多媒体文件,所述多媒体文件包括人声音轨音频和伴奏音轨音频;
获取所述人声音轨音频中的第一音频片段以及所述伴奏音轨音频中的第二音频片段;
获取所述第一音频片段与所述第二音频片段之间的归一相关函数;
基于所述归一相关函数的第一峰值,识别所述多媒体文件的属性,所述第一峰值是指所述归一相关函数的最大幅值,所述属性为真唱文件或假唱文件。
在一种可能的设计中,所述基于所述归一相关函数的第一峰值,识别所述多媒体文件的属性,包括:
当所述第一峰值小于第一峰值阈值时,确定所述多媒体文件的属性为真唱文件,所述第一峰值阈值为小于多个样本假唱文件的第一峰值的最小值的数值。
在一种可能的设计中,所述基于所述归一相关函数的第一峰值,识别所述多媒体文件的属性,包括:
当所述第一峰值符合第一预设条件,且所述第一峰值大于第二峰值阈值时,确定所述多媒体文件的属性为假唱文件,所述第一预设条件为第一峰值的位置处于中值区间,所述中值区间是指在所述归一相关函数的中值前后分别取预设长度得到的区间,所述第二峰值阈值为大于多个第一样本真唱文件的第一峰值的最大值的数值,第一样本真唱文件为第一峰值符合所述第一预设条件的样本真唱文件;或,
当所述第一峰值符合第二预设条件,且所述第一峰值大于第三峰值阈值时,确定所述多媒体文件的属性为假唱文件,所述第二预设条件为第一峰值的位置处于中值区间内、且第一峰值为第二峰值的预设倍数以上,所述第二峰值是指所述归一相关函数在中值区间之外的最大幅值,所述第三峰值阈值为大于多个第二样本真唱文件的第一峰值的最大值的数值,第二样本真唱文件为第一峰值符合所述第二预设条件的样本真唱文件。
在一种可能的设计中,所述基于所述归一相关函数的第一峰值,识别所述多媒体文件的属性,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711274772.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种订单查询方法及系统
- 下一篇:基于成组技术的产品零件分类编码系统构建方法