[发明专利]音乐识别方法、音符识别模型建立方法、装置及电子设备有效

申请号：	201610113604.6	申请日：	2016-02-29
公开（公告）号：	CN107146631B	公开（公告）日：	2020-11-10
发明（设计）人：	李贝;陈伟;姚光超;唐文琦	申请（专利权）人：	北京搜狗科技发展有限公司
主分类号：	G10L25/90	分类号：	G10L25/90;G10L25/51;G10L19/02
代理公司：	北京华沛德权律师事务所 11302	代理人：	马苗苗
地址：	100084 北京市海淀区中关***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及自动化领域，公开了一种音乐识别方法、音符识别模型建立方法、装置及电子设备，以解决现有技术中在对音乐进行识别时需要依赖于特定的硬件设备的技术问题。该方法包括：在获得音乐所对应的第一音频数据中之后，可以基于第一音频数据中所包含的M个音符片段和音符模型，对第一音频数据进行匹配识别其中，所述音符模型中包含至少一组音符片段与特征信息的对应关系，也即是不需要硬件改进，就可以实现对第一音频数据中相关信息的识别，故而达到了提高对音乐识别的兼容性的技术效果。
搜索关键词：	音乐识别方法音符模型建立装置电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种音乐识别方法，其特征在于，包括：获得音乐所对应的第一音频数据，所述第一音频数据包含M个音符片段，M为正整数；基于所述M个音符片段和音符模型，对所述第一音频数据进行匹配识别，其中，所述音符模型中包含至少一组音符片段与特征信息的对应关系。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司，未经北京搜狗科技发展有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610113604.6/，转载请声明来源钻瓜专利网。

上一篇：一种用于即时通信的语音消息发送方法、装置及系统
下一篇：一种氧化铝包覆锂离子电池正极材料的制备方法

同类专利

音高线生成方法、装置、设备及存储介质-202010301415.8
发明人：汤伯超 -专利权人：广州繁星互娱信息科技有限公司
申请日： 2020-04-16 - 公布日： 2023-10-13 - 主分类号： G10L25/90
摘要：本申请公开了一种音高线生成方法、装置、设备及存储介质，属于计算机和互联网技术领域，所述方法包括：获取目标歌曲的n个歌曲音高信息；根据n个歌曲音高信息，确定目标歌曲的第一标准音高信息；根据第一标准音高信息，生成目标歌曲的第一音高线模型。本申请实施例提供了一种自动生成音高线的方法，提升了生成音高线的效率，节约了人力成本。并且，本申请实施例中，歌曲音高信息是用户演唱目标歌曲时生成的音高信息，从而根据多个歌曲音高信息确定的标准音高信息，融合了不同用户的演唱特点，以及同一用户在不同时刻的演唱特点，提升了根据该标准音高信息生成的音高线模型的通用性。

人声基频范围确定方法、电子设备及存储介质-202310471776.0
发明人：胡云燎;杨明祺;张博闻 -专利权人：名日之梦（北京）科技有限公司
申请日： 2023-04-27 - 公布日： 2023-07-18 - 主分类号： G10L25/90
摘要：本发明公开一种人声基频范围确定方法、电子设备及存储介质。方法包括：获取人声基频分布，所述人声基频分布包括人声基频的多个频率以及对应幅值；对所述人声基频分布进行双拟合，得到两个拟合分布；基于两个所述拟合分布的比较结果，确定所述人声基频分布的频率范围的最小边界值和/或最大边界值。本发明通过对人声基频分布进行双拟合得到两个拟合分布，并基于两个拟合分布进行比较，准确确定人声基频分布的频率范围的最小边界值和/或最大边界值，从而可以正确的计算基频的值。

基于BP神经网络模型的音乐主旋律识别方法及装置-202310401153.6
发明人：程超志 -专利权人：怀化学院
申请日： 2023-04-12 - 公布日： 2023-07-07 - 主分类号： G10L25/90
摘要：本发明实施例中提供了一种基于BP神经网络模型的音乐主旋律识别方法、装置及电子设备，属于人工智能技术领域，该方法包括：针对数据集中的数据进行特征融合，以便于提高训练模型的音乐分类效果；基于人类发音元音时声带和声道特征持续变化的特点，构建元音发音时相邻语音帧的谐波能量互相关值较大的假设；使用多种类型的语料库来验证谐波能量互相关值较大的假设，用以训练BP神经网络模型；采用训练后的BP神经网络模型对音乐主旋律进行识别。采用本方案，能够避免复杂的学习算法和数学模型，可应用于多个说话人的盲分离、语音降噪等领域。

音符音高值的确定方法、装置、设备及存储介质-202110444040.5
发明人：劳振锋;陈传艺;孙洪文;关迪聆 -专利权人：广州酷狗计算机科技有限公司
申请日： 2021-04-23 - 公布日： 2023-07-04 - 主分类号： G10L25/90
摘要：本申请公开了一种音符音高值的确定方法、装置、设备及存储介质，属于音频处理技术领域，所述方法包括：获取音频数据对应的第一歌曲中歌词元素的音高信息；基于每个歌词元素的音高信息，确定相应歌词元素的音符音高信息，歌词元素的音符音高信息包括歌词元素的音符对应的音高信息；获取每个歌词元素的稳定发声部分的音符音高信息，得到相应歌词元素的目标音符音高信息；基于每个歌词元素的目标音符音高信息，确定相应歌词元素的音符音高值。本申请实施例实现了有效去除歌词元素的音符音高信息中，由于演唱对象气息不稳定、不同歌词元素切换不畅等导致的偏差较大的音符音高信息，提高歌词元素的音符音高值的计算准确性。

语音识别方法及电子设备、计算机可读存储介质-202010484431.5
发明人：彭婕 -专利权人：广东小天才科技有限公司
申请日： 2020-06-01 - 公布日： 2023-06-27 - 主分类号： G10L25/90
摘要：本申请实施例涉及电子设备技术领域，公开了一种语音识别方法及电子设备、计算机可读存储介质，该方法包括：获取通过音频模块采集的用户跟读测评内容的语音信息；识别出语音信息中每一个语音单元对应的语调，得到语音信息对应的语调序列；判断语调序列与标准语调序列是否相匹配，该标准语调序列根据测评内容对应的表述场景确定出；若不匹配，输出标准语调序列供用户参考。实施本申请实施例，能够提高用户的口语能力。

编码方法、编码装置以及记录介质-201811009738.9
发明人：守谷健弘;鎌本优;原田登;日和崎佑介;福井胜宏 -专利权人：日本电信电话株式会社
申请日： 2013-05-22 - 公布日： 2023-02-17 - 主分类号： G10L25/90
摘要：本发明的编码方法包括：周期换算步骤，时域的基音周期L与预定的时间区间的音响信号的时域基音周期码对应，且获得与上述时域的基音周期L对应的频域的样本间隔作为换算间隔T1；频域基音周期分析步骤，从包括上述换算间隔T1以及上述换算间隔T1的整数倍的值U×T1的候选值中决定源于上述音响信号的频域样本串的基音周期、即第一频域基音周期T，获得表示上述第一频域基音周期T是上述换算间隔T1的几倍的第一频域基音周期码，其中，U是预先决定的第一范围的整数；以及频域基音周期考虑编码步骤，将上述频域样本串以基于上述第一频域基音周期T的编码方法进行编码。

确定音高特征的方法、装置、设备及存储介质-201911388447.X
发明人：劳振锋;肖纯智 -专利权人：广州酷狗计算机科技有限公司
申请日： 2019-12-30 - 公布日： 2023-01-10 - 主分类号： G10L25/90
摘要：本申请公开了一种确定音高特征的方法、装置、设备及存储介质，属于音频处理技术领域。所述方法包括：提取歌曲中的目标字符的多个第一音高特征值，该目标字符为该歌曲中的任意一个或者多个字符；基于该多个第一音高特征值，确定该目标字符的多个第一MIDI音高值；获取该多个第一MIDI音高值中时间靠后的指定阈值个属于人声范围内的第一MIDI音高值，得到多个第二MIDI音高值；根据该多个第二MIDI音高值，从该多个第一音高特征值中确定该目标字符的第二音高特征值。本申请确定的第二音高特征值对应的第二音高特征比较可靠，即准确度比较高。

颤音检测方法、计算机设备、存储介质和计算机程序产品-202211178090.4
发明人：张超鹏;陈梦;赵伟峰;姜涛;胡鹏 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2022-09-23 - 公布日： 2023-01-03 - 主分类号： G10L25/90
摘要：本申请涉及一种颤音检测方法、计算机设备、存储介质和计算机程序产品。所述方法包括：对待检测干声的基频序列进行歌词切分处理，得到所述待检测干声中各个歌词对应的基频片段；对每个基频片段进行滤波处理，得到所述每个基频片段对应的降噪基频片段；确定所述每个降噪基频片段的波动幅度和波动频率；根据所述每个降噪基频片段的波动幅度和波动频率是否满足预设颤音条件，得到所述每个降噪基频片段的颤音检测结果，其中每个降噪基频片段的颤音检测结果为所述待检测干声的颤音检测结果。采用本方法能够提高干声的颤音检测准确率。

歌唱技巧检测方法、歌唱技巧展示方法和计算机设备-202210680360.5
发明人：陈梦 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2022-06-16 - 公布日： 2022-10-11 - 主分类号： G10L25/90
摘要：本申请涉及一种歌唱技巧检测方法、歌唱技巧展示方法、计算机设备和计算机程序产品。通过获取待检测音频，并获取待检测音频对应的基频序列，获取基频序列中各个基频的音高变化幅度，根据该音高变化幅度确定各个基频对应的音高变化趋势，再根据各音高变化趋势的持续时间以及基频序列在该持续时间内的音高变化数值，确定基频序列区间中对应的歌唱技巧。相较于传统的基于深度学习建模的方式识别音频中的歌唱技巧信息，本方案通过利用音频的基频的音高变化信息，确定音频中存在的歌唱技巧，可以实现提高歌唱技巧检测效率的效果。

音高提取方法、装置和电子设备-202210695337.3
发明人：梁夏;朱碧磊;马泽君 -专利权人：北京有竹居网络技术有限公司
申请日： 2022-06-17 - 公布日： 2022-08-30 - 主分类号： G10L25/90
摘要：本申请实施例公开了音高提取方法、装置和电子设备。该方法的一具体实施方式包括：获取音频片段和音频片段中发声对象的音色特征；将音频片段转换成梅尔频谱，以及将音色特征与梅尔频谱相连接，得到融合特征；基于融合特征和预先训练的目标模型，确定输出结果，其中，输出结果包括发声对象的音高信息。该实施方式可以在噪声较强的环境下提高音高提取的准确性。

一种改进的病理嗓音基音频率提取方法-201810797265.7
发明人：张涛;武雅琴 -专利权人：天津大学
申请日： 2018-07-19 - 公布日： 2022-05-10 - 主分类号： G10L25/90
摘要：一种改进的病理嗓音基音频率提取方法：进行信号预处理，包括去直流处理和分帧处理；进行小波包分解及重构，小波包分解是采用Duabeechies系列小波中的db6将分帧处理后的信号进行分解，得到重构所需的信号，分解的层数是根据采样频率和信号基频上限来定；重构是根据分解后的每层信号与所对应的分解前的帧信号的相关性和信号基频范围重构分解前的帧信号；将重构后的帧信号进行HHT变换处理，得到若干个IMF分量，剔出不满足频率条件的IMF分量，再进行重构HHT变换前的分帧信号；对重构HHT变换前的分帧信号进行基频提取。本发明保证提取的病理嗓音基音频率仍然基本保持在原本的基频范围内，保证了嗓音基音频率提取准确率。

一种颤音识别的方法与装置-201910979091.0
发明人：宋冬梅;武剑;王宏 -专利权人：北京雷石天地电子技术有限公司
申请日： 2019-10-15 - 公布日： 2022-04-01 - 主分类号： G10L25/90
摘要：本发明提供一种颤音识别的方法与装置，所述方法包括：获取待检测音频数据，从所述待检测音频数据中截取有效音频检测片段，当所述有效音频检测片段时长大于颤音最小时长要求时，计算所述有效音频检测片段所有帧的音调，得到音调序列，对所述音调序列进行分组，计算每一分组的音调标准差和目标周期，删除所述音调标准差大于预设标准差阈值以及所述目标周期大于预设颤音周期最小值或小于预设颤音周期最大值的分组，计算剩余分组在删除前总组数中所占的比值，若所述比值大于一预设参数，判定为颤音信号。通过上述方案解决了现有颤音识别准确度不高的问题，本发明不仅提高了颤音识别的精度，同时可精确定位颤音位置和颤音时长。

一种音频处理方法、装置、电子设备及可读存储介质-202111032567.3
发明人：周勇 -专利权人：北京奇艺世纪科技有限公司
申请日： 2021-09-03 - 公布日： 2022-01-11 - 主分类号： G10L25/90
摘要：本申请提供了一种音频处理方法、装置、电子设备及可读存储介质，属于数据处理技术领域。本申请通过获取目标音频的第一音频帧集合和参考音频的第二音频帧集合；按照所述第二音频帧集合中的语义特征对所述第一音频帧集合中的语义特征执行时域维度上的对齐处理，得到所述第一音频帧集合对应的目标音频帧集合；确定所述目标音频帧集合对应的第一音高集合，以及，确定所述第二音频帧集合对应的第二音高集合；基于所述第一音高集合和所述第二音高集合确定调整策略；利用所述调整策略对所述目标音频的音高进行调整。以避免由于没有考虑用户自身的音高造成失真的情况。

一种基于多重相关性计算的乐音基频提取方法-202110975783.5
发明人：王军;马连航;阮林萍;汪万涛;文亮;赵罡;程竞泽 -专利权人：中电海康集团有限公司
申请日： 2021-08-24 - 公布日： 2021-12-10 - 主分类号： G10L25/90
摘要：本发明公开了一种基于多重相关性计算的乐音基频提取方法，包括：对实时获取的音频帧进行傅里叶变换得到原始频谱图；对所述原始频谱图进行预处理得到标准频谱图；基于标准数据频谱图根据音高和频率的固有关系得到音高模板；根据标准频谱图和音高模板得到低维频谱图；基于多重相关性计算低维频谱图和音高模板之间的综合匹配度：若综合匹配度大于阈值，则判定低维频谱图与音高模板一致，则该音高模板对应的基频值作为针对实时获取的音频帧所提取的基频。本发明提供的基于多重相关性计算的乐音基频提取方法，适用于实时和非实时基频提取，且提取准确率高。

一种乐器演奏或演唱测评方法及系统-202110616599.1
发明人：魏新元;段志尧;何欣燕;李博琛 -专利权人：深圳芒果未来教育科技有限公司
申请日： 2021-06-02 - 公布日： 2021-11-30 - 主分类号： G10L25/90
摘要：本发明公开了一种乐器演奏或演唱测评方法及系统，方法包括：获取演奏或演唱的音频信号的特征并进行音高估计；将音频信号和乐谱参考信号实时对齐，并将实时对齐结果以以光标方式实时指示在乐谱对应音符位置上；判断测评是否结束，若测评结束则获取演奏或演唱音频同时确定演奏或演唱在乐谱上的结尾点；根据演奏或演唱的结尾点，将已录到的音频与乐谱参考信号计算离线对齐路径；统计演奏或演唱中的节奏错误；比较演奏或演唱音频中音符的音高与乐谱参考信号的音高是否一致，统计音符不一致的结果作为音准错误；根据节奏错误和音准错误对演奏或演唱打分。本发明实现了演奏或演唱的自动化测评打分，提高了测评的准确度和效率。

非常短的基音周期检测和编码-201710341997.0
发明人：高扬;齐峰岩 -专利权人：华为技术有限公司
申请日： 2012-12-21 - 公布日： 2021-10-26 - 主分类号： G10L25/90
摘要：为用于语音或音频信号的非常短的基音周期检测和编码提供了系统和方法实施例。该系统和方法包括使用时域和频域基音周期检测技术的组合在语音或音频信号中检测是否存在比常规最小基音周期限制更短的非常短的基音周期。基音周期检测技术包括使用时域中的基音相关系数和检测频域中的语音或音频信号中的低频能量的缺少。使用开始于预定义最小的非常短的基音限制(小于常规最小基音限制)的基音周期范围对检测到的非常短的基音周期进行编码。

一种音乐分析数据集构建方法及基于其的音高、时值提取方法-201910669985.X
发明人：李惠子;曹琛;冯亚星 -专利权人：深圳市平均律科技有限公司
申请日： 2019-07-25 - 公布日： 2021-08-31 - 主分类号： G10L25/90
摘要：本发明公开了一种音乐分析数据集构建方法及基于其的音高、时值提取方法，主要解决现有技术中存在的传统方法在单音识别细分领域中性能表现良好，但在复音识别领域中的性能表现相对较弱的问题。该一种音乐分析数据集构建方法及基于其的音高、时值提取方法包括通过选择数字曲谱登记入数字曲谱库；演奏者演奏曲谱登记入数字声音库；将类别标签序列与声音特征匹配形成声音特征‑音乐元素数据集的构建方法；基于数据集对乐音乐器中音高和时值的提取方法及系统。通过上述方案，本发明达到了利用监督机器学习模型提取乐音乐器演奏生成的数字声音信号的时值信息和音高信息，能较好的提取复音中音乐元素的目的，具有很高的实用价值和推广价值。

一种基于数据集的乐音乐器声音中音高和时值的提取方法-202110634335.9
发明人：李惠子;曹琛;冯亚星 -专利权人：深圳市平均律科技有限公司
申请日： 2019-07-25 - 公布日： 2021-08-03 - 主分类号： G10L25/90
摘要：本发明公开了一种基于数据集的乐音乐器声音中音高和时值的提取方法，主要解决现有技术中存在的传统方法在单音识别细分领域中性能表现良好，但在复音识别领域中的性能表现相对较弱的问题。该一种基于数据集的乐音乐器声音中音高和时值的提取方法包括通过选择数字曲谱登记入数字曲谱库；演奏者演奏曲谱登记入数字声音库；将类别标签序列与声音特征匹配形成声音特征‑音乐元素数据集的构建方法；基于数据集对乐音乐器中音高和时值的提取方法及系统。通过上述方案，本发明达到了利用监督机器学习模型提取乐音乐器演奏生成的数字声音信号的时值信息和音高信息，能较好的提取复音中音乐元素的目的，具有很高的实用价值和推广价值。

一种基于数据集的乐音乐器声音中音高和时值的提取系统-202110634456.3
发明人：李惠子;曹琛;冯亚星 -专利权人：深圳市平均律科技有限公司
申请日： 2019-07-25 - 公布日： 2021-08-03 - 主分类号： G10L25/90
摘要：本发明公开了一种基于数据集的乐音乐器声音中音高和时值的提取系统，主要解决现有技术中存在的传统方法在单音识别细分领域中性能表现良好，但在复音识别领域中的性能表现相对较弱的问题。该一种基于数据集的乐音乐器声音中音高和时值的提取系统包括通过选择数字曲谱登记入数字曲谱库；演奏者演奏曲谱登记入数字声音库；将类别标签序列与声音特征匹配形成声音特征‑音乐元素数据集的构建方法；基于数据集对乐音乐器中音高和时值的提取方法及系统。通过上述方案，本发明达到了利用监督机器学习模型提取乐音乐器演奏生成的数字声音信号的时值信息和音高信息，能较好的提取复音中音乐元素的目的，具有很高的实用价值和推广价值。

音频文件的音高识别方法、装置以及存储介质-201910578513.3
发明人：黄安麒;李深远;董治 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2019-06-28 - 公布日： 2021-08-03 - 主分类号： G10L25/90
摘要：本发明实施例公开了一种音频文件的音高识别方法、装置以及存储介质；本发明实施例通过获取音频文件，音频文件包括音频数据，然后，从音频文本中提取预设时间点对应的文字，得到多个音频单字，紧接着，获取音频单字的在音频文本中的音高独立概率，再然后，根据多个音频标签，获取音频单字在所述音频文本中的音高变化概率，最后，对音高独立概率以及音高变化概率进行处理，得到音频文件的音高结果。相对于现有的方案而言，可以避免识别的音高存在与音频文本不对应或音高漏识别的情况发生，因此，可以提高音高识别结果的准确率。

一种离散点的语音基音识别装置及计算机存储介质-202110375951.7
发明人：陈夏盛;林荔珊 -专利权人：深圳市品索科技有限公司
申请日： 2021-04-08 - 公布日： 2021-07-13 - 主分类号： G10L25/90
摘要：本发明提供了一种离散点的语音基音识别装置，包括语音接收模块、去噪模块、基音粗算模块、基音精算模块和基音提取模块，所述语音接收模块接收外部的语音并转换成离散点信号，所述去噪模块对所述离散点信号进行去噪处理，所述基音粗算模块用于对离散点进行计算处理得到一个基音的频率范围，所述基音精算模块在所述频率范围内进行计算处理得到基音的频率值，所述基音提取模块根据所述频率值从语音中提取出基音。本发明先通过所述基音粗算模块对基音的频率范围进行缩小限定，再通过所述基音精算模块计算出准确的基音频率值，大大地减小了计算的复杂程度，提高识别效率。

基音检测方法、装置、存储介质及移动终端-201811273595.2
发明人：陈岩 -专利权人： OPPO广东移动通信有限公司
申请日： 2018-10-30 - 公布日： 2021-06-08 - 主分类号： G10L25/90
摘要：本申请实施例公开了基音检测方法、装置、存储介质及移动终端。该方法包括：获取移动终端的语音通话信号；对所述语音通话信号进行带通滤波的预处理操作，得到预处理后的目标语音通话信号；计算所述目标语音通话信号的归一化相关函数；根据所述归一化相关函数确定第一预设数量个目标基音周期候选值，并根据所述归一化相关函数从所述第一预设数量个目标基音周期候选值中确定所述语音通话信号的基音周期。通过本申请实施例提供的技术方案，能够准确估计基音周期，有效提高对含噪语音通话信号的基音检测的准确性。

基于重音分析的人声转乐谱系统-201910192278.6
发明人：邱兆林;黄怡璠;刘洪甫;李灿晨;季俊涛;任宇凡;张克俊 -专利权人：浙江大学
申请日： 2019-03-14 - 公布日： 2021-05-14 - 主分类号： G10L25/90
摘要：本发明公开了一种基于重音分析的人声转乐谱系统，该人声转乐谱系统应用时，实现以下步骤：(1)对人声音频进行采样，获得多个样本片段，然后对每个样本片段进行频率分析；(2)对每个样本片段进行重音分析；(3)根据重音分析结果和频率分析结果，对人声音频进行音符分割；(4)获得每个音符后，根据频率变化，测定每个音符的音高；(5)在获得每个音符的音高后，基于绝对音高对乐谱进行调性分析和调整，以获得最终的乐谱。该人声转乐谱系统能够时间将输入人声信号转化为乐谱。

一种歌曲基频提取方法及装置-201910232063.2
发明人：宋冬梅;武剑;王宏 -专利权人：北京雷石天地电子技术有限公司
申请日： 2019-03-26 - 公布日： 2021-04-09 - 主分类号： G10L25/90
摘要：本发明公开了一种歌曲基频提取方法，具体包括：获取所述歌曲的原唱文件、伴奏文件和歌词文件；根据所述原唱文件和伴奏文件，提取人声数据；对所述人声数据进行分帧处理；提取所述歌词文件中每一单独字的起始位置和结束位置；计算每个单独字的音调数据组；根据所述每个单独字的音调数据组，生成所述歌曲的基频文件。本发明还公开了一种歌曲基频提取装置，能够实现上述歌曲基频提取方法。本发明能够极大地降低音调提取地错误率。

进度条的调节方法、装置、终端及存储介质-202011455481.7
发明人：段小磊 -专利权人：广州酷狗计算机科技有限公司
申请日： 2020-12-10 - 公布日： 2021-04-06 - 主分类号： G10L25/90
摘要：本公开提供了一种进度条的调节方法、装置、终端及存储介质，属于电子技术领域。所述方法包括：在多媒体文件的播放过程中，采集目标用户的音频数据；从音频数据中提取音调数据；根据音调数据，确定目标用户的音调变化趋势；根据目标用户的音调变化趋势，对多媒体文件的进度条进行调节。本公开基于音调变化趋势，对多媒体文件的进度条进行调节。在声学领域，音调通常用于表征声音频率的高低，用户无需说出具体的语音内容，只需发出简单的音频即可，对于不同语种的用户而言，无需构建不同语种对应的语法数据库，大大降低了对进度条的调节成本。

音频切割方法及装置-201710702982.2
发明人：陈杰;徐滢 -专利权人：成都品果科技有限公司
申请日： 2017-08-16 - 公布日： 2021-04-02 - 主分类号： G10L25/90
摘要：本发明提供一种音频切割方法及装置，涉及多媒体技术领域。所述方法及装置通过获取目标音乐，并根据所述目标音乐的声音振幅信息设置多个标记点；从所述多个标记点中选取切割点，以使选取的所述切割点中相邻切割点之间的间隔时长不小于第一预设时长；输出多个所述切割点在所述目标音乐中对应的时间点，形成切割点时间序列。该方法及装置简化了操作人员对音乐切割的操作步骤，提高了对音乐切割的效率。另外，通过声音振幅信息进行选取还提高了选取切割点的有效性和准确率。

确定音频得分的方法、装置、终端及存储介质-201811049705.7
发明人：劳振锋 -专利权人：广州酷狗计算机科技有限公司
申请日： 2018-09-07 - 公布日： 2021-02-12 - 主分类号： G10L25/90
摘要：本发明公开了一种确定音频得分的方法、装置、终端及存储介质，属于互联网技术领域。该方法包括：获取待打分的目标音频文件，该目标音频文件包括目标对象演唱目标歌曲时的音频数据；根据多个音频采样点在当前音调下的音高，对该目标音频文件进行变调处理，得到该多个音频采样点在多个音调下的音高，该多个音频采样点为该目标音频文件中的采样点；根据该多个音频采样点在多个音调下的音高和该目标歌曲的标准音高，确定该目标音频文件在该多个音调下的得分，该标准音高为该目标歌曲的原唱中的音高；根据该目标音频文件在该多个音调下的多个得分，确定该目标音频文件的目标得分。通过多个音调下的多个得分确定打分，提高了确定音频得分的准确性。

一种主旋律的生成方法、装置、电子设备及存储介质-202011194180.3
发明人：顾宇 -专利权人：北京有竹居网络技术有限公司
申请日： 2020-10-30 - 公布日： 2021-02-02 - 主分类号： G10L25/90
摘要：本申请公开了一种主旋律的生成方法、装置、电子设备及存储介质。方法包括：获取歌词文本，其中，歌词文本中包含每个歌词的声调；根据编曲指令生成音符序列；根据歌词文本对音符序列的音高进行校正，获得与歌词文本所匹配的主旋律。通过包含歌词声调的歌词文本，对根据编曲指令所生成的音符序列的音高进行校正，从而通过歌词的声调确定音符序列的音高，以提高主旋律的可唱性，并使得所生成的主旋律符合用户的歌唱习惯。

一种基音检测方法及装置-202010907190.0
发明人：杨晓云 -专利权人：北京佳讯飞鸿电气股份有限公司
申请日： 2020-09-02 - 公布日： 2021-01-08 - 主分类号： G10L25/90
摘要：本公开涉及一种基音检测方法及装置。该方法包括如下步骤：获取语音采集装置发送的多帧语音数据，并对每一帧语音数据进行解码和预处理；分别计算经预处理的每一帧语音数据的基音检测核心函数，得到相应的基音检测核心函数曲线；根据每一帧语音数据的基音检测核心函数曲线，得到每一帧语音数据的基音周期；根据当前帧语音数据的基音周期阈值，验证该帧语音数据的基音检测是否有效。该方法有效地抑制了共振峰的影响，在低信噪比环境下能有效检测到基音周期，更准确地定位基音周期的位置，从而提高了基音检测精度，并解决传统的时域基音检测方法准确度较差的问题。此外，在实际运用中能够较好地满足语音信号处理对基音检测的要求，从而提高了语音信号处理的性能。

基音周期的确定方法、装置、计算机设备和存储介质-201810607513.7
发明人：袁念德;邵明绪;田姣 -专利权人：西安蜂语信息科技有限公司
申请日： 2018-06-13 - 公布日： 2020-12-04 - 主分类号： G10L25/90
摘要：本申请涉及一种基音周期的确定方法、装置、计算机设备和存储介质。所述方法包括：当待测音频信号在当前帧中为浊音信号时，则根据预设的代价函数，获取所述待测音频信号在当前帧中的各第一基音周期的目标代价值；其中，所述目标代价值包括：所述待测音频信号的各第一基音周期与在关联帧中各第二基音周期之间的代价值，所述关联帧包括：与所述当前帧相邻的历史帧、以及位于所述当前帧之后的前导帧集合；根据各目标代价值，从各第一基音周期中确定所述待测音频信号在当前帧中的目标基音周期。采用本方法能够提高基音周期的准确性。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]音乐识别方法、音符识别模型建立方法、装置及电子设备有效

专利文献下载