[发明专利]音乐大数据检索的专业声乐旋律特征提取方法在审
申请号: | 202211216510.3 | 申请日: | 2022-09-30 |
公开(公告)号: | CN115527514A | 公开(公告)日: | 2022-12-27 |
发明(设计)人: | 钟国健 | 申请(专利权)人: | 恩平市奥科电子科技有限公司 |
主分类号: | G10H1/00 | 分类号: | G10H1/00;G10H1/02;G10L19/02;G10L19/26 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 529400 广东省江门市恩平*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音乐 数据 检索 专业 声乐 旋律 特征 提取 方法 | ||
本申请提出一种采用基于音高轮廓声乐计量特征与整面域优化的旋律提取方法,基于专业声乐旋律特征分为频率分解、显著性计算、建立音高轮廓以及旋律生成四个步骤,大幅提高了对专业声乐特征提取的准确性;采用等响度滤波器优化处理使得信号的频率分布更符合人类听觉,改进信号相位信息缓解傅里叶变换存在的分辨率问题;利用类比谐波加权求和的方式计算谱峰显著性,使得显著性更加符合听觉原理;缓解浊音帧被误过滤的问题;采用基于音高轮廓声乐计量特征的方式优化旋律生成阶段,采用显著性加权的方式对旋律参考线进行不断调整,获得具有更高鲁棒性,能更好表征音频数据,并具有更强普适性和专业性的特征。
技术领域
本申请涉及一种音频大数据特征检索提取方法,特别涉及一种音乐大数据检索的专业声乐旋律特征提取方法,属于声音大数据处理技术领域。
背景技术
随着网络技术的发展,音频信息呈现爆炸式的增长,在海量数据中进行有效检索的难度日益增加。音乐的存储、访问、分发和消费的方式在过去的几十年内发生了根本性的变化,如今,大型的音乐数据库中的记录可能存储在作为分销商、数字图书馆的服务器及个人计算机上,数以千万计的的音乐数据集合可以从世界各地访问。对于如此大量的容易获得的音乐信息,需要更加高效和专业的检索策略来引导用户轻松快速的获得感兴趣的内容。
然而,传统的音频检索策略依赖于人为标注的描述音乐信息的文本元数据信息,大多数搜索引擎依赖于元数据以及基于内容的文本注释,编辑元数据通常包括艺术家、标题以及其它相关信息。尽管与这种基于文本注释的检索策略相关的新技术的不断涌现,但一方面基本上还是受制于文本检索技术;另一方面当音乐数据量变得非常大时,要保持一致的描述信息非常困难。这种方式已经逐渐无法满足人们的检索需求,因为这种注释信息通常是模糊、不准确、不足以描述音乐数据的复杂性和专业性的,而且带有一定的主观性。
仅基于元数据的检索系统的一个缺点是用户需要明确的知道他要寻找的音频的相关信息,即基于元数据的检索方式仅仅允许搜索已知的内容。为了克服这些限制,有利用基于音乐内容的一般表达和注释,即标签来对检索系统进行优化。为了进一步的降低建立标签系统的难度,有的系统采用用户标注的方式来获得标签,但以这种途径获得的标签,通常不太准确,且带有有非常严重的的主观性,并且会存在噪声,即这种方式获得的标签在不同的用户之间表现出高度的可变性,当系统规模逐渐扩大时,这种方式建立的标签系统甚至会变得不可用。依赖于大量用户创建可靠注释的发发发,虽然对于较为流行的音乐而言不存在较大问题,但对于一些刚刚发布,或不太热门的音乐而言,基本上不存在可靠的标记。
为了克服上述系统的种种劣势,现有技术提出了基于内容的检索,因为这种系统基本上不依赖于任何手动创建的数据来引导检索过程,而是基于音乐数据内容,可再现的方式获得的覆盖整个音乐数据的特征,通常获得的特征具有很强的客观性。通过输入一段音乐数据或乐谱信息,然后获得与输入相同的或在某种程度上具有一定相似性(例如风格、艺术家)的数据。用户可以很方便的实现检索目的,并且这种技术有助于推荐方法、分类技术的发展,从而进一步提升检索系统的性能。
基于内容的音频检索的需求会越来越大,且将具有广泛的应用前景。但如何获得具有更高鲁棒性,能更好的表征音频数据,并具有更强的普适性和专业性的特征,已成为研发重点。另外,在大规模检索系统中,如何更加快速、更加精确的获得结果,也是亟需解决的问题。
综上,现有技术的音乐大数据检索特征提取仍然存在若干问题和缺陷,本申请需要解决的问题和关键技术难点包括:
(1)现有技术一大类的音频检索策略依赖于人为标注的描述音乐信息的文本元数据信息,大多数搜索引擎依赖于元数据以及基于内容的文本注释,尽管与这种基于文本注释的检索策略相关的新技术的不断涌现,但一方面基本上还是受制于文本检索技术;另一方面当音乐数据量变得非常大时,要保持一致的描述信息非常困难,这种方式已经逐渐无法满足人们的检索需求,因为这种注释信息通常是模糊、不准确、不足以描述音乐数据的复杂性和专业性的,而且带有一定的主观性,特别是对于专业声乐旋律特征严重依赖文本注释,鲁棒性差,并且结果的精确无法保证,面对海量音频数据标注的工作量太大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恩平市奥科电子科技有限公司,未经恩平市奥科电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211216510.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置