[发明专利]一种音频质量检测方法及音频质量检测系统有效

申请号：	201710517195.0	申请日：	2017-06-29
公开（公告）号：	CN107170465B	公开（公告）日：	2020-07-14
发明（设计）人：	宋扬;程兰颖;赵涛	申请（专利权）人：	数据堂（北京）科技股份有限公司
主分类号：	G10L25/06	分类号：	G10L25/06;G10L25/60;G10L25/51
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	王宝筠
地址：	100190 北京市海淀区中关村大街18号B座1801、18***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本申请公开了一种音频质量检测方法及音频质量检测系统，其中，所述音频质量检测方法通过计算各个通道采集的音频数据的相关性来获得各通道设备内音频异常检测结果；并且为了避免所述待检测设备所有通道出现同样的问题以及各种噪音导致的检测异常，所述音频质量检测方法通过获取参考设备的参考通道的音频数据，并根据参考通道的音频数据和目标通道的音频数据的相关性计算来获得设备间音频异常检测结果，并综合所述待检测设备各通道设备内音频异常检测结果和目标通道设备间检测结果综合生成音频检测报告，从而在实现了对多通道同步音频采集设备的音频质量的自动检测的基础上，增加了所述音频质量检测方法的鲁棒性。
搜索关键词：	一种音频质量检测方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种音频质量检测方法，其特征在于，用于检测多通道同步音频采集设备的音频质量，所述多通道同步音频采集设备具有多个通道，每个所述通道用于采集音频数据；所述音频质量检测方法包括：获取待检测设备每个通道的音频数据，构成待测音频组；获取参考设备参考通道的音频数据；对所述待测音频组中的音频数据和所述参考通道的音频数据进行时域分帧和特征提取处理，获得待检测设备各个通道的多个帧特征向量以及所述参考通道的多个帧特征向量；利用所述待检测设备各个通道的帧特征向量进行相关性计算及帧相关判决，获得所述待检测设备各个通道的多个判决结果；利用所述参考通道的帧特征向量和所述待检测设备目标通道的帧特征向量进行相关性计算及帧相关判决，获得所述目标通道的多个设备间判决结果，所述目标通道为所述待检测设备多个通道中的任意一个；根据所述待检测设备各个通道的多个判决结果，判断所述待检测设备各个通道是否异常，获得所述待检测设备各个通道的设备内音频异常检测结果；根据所述目标通道的多个设备间判决结果，判断所述待检测设备目标通道是否异常，获得所述目标通道的设备间音频异常检测结果；根据所述待检测设备各个通道的设备内音频异常检测结果和所述目标通道的设备间音频异常检测结果，生成音频检测报告。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于数据堂（北京）科技股份有限公司，未经数据堂（北京）科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710517195.0/，转载请声明来源钻瓜专利网。

同类专利

一种基于Sym8小波包变换的音频复制粘贴检测方法-202310762433.X
发明人：李晓龙;张文涵;赵耀 -专利权人：北京交通大学
申请日： 2023-06-26 - 公布日： 2023-10-27 - 主分类号： G10L25/06
摘要：本发明提供一种基于Sym8小波包变换的音频复制粘贴检测方法，包括如下过程：通过对原音频信号进行分帧加窗操作，生成多帧信号；计算多帧音频信号中每帧信号的Sym8小波包变换系数，生成每帧信号的特征；根据每帧信号特征，计算每帧信号特征之间相关性，生成相关系数矩阵；根据相关系数矩阵，确定相关性阈值，将相关性阈值与相关系数矩阵进行比较，得到原音频信号篡改情况及篡改位置。本发明提供的方法相对于现有技术，通过减少静音段检测部分，新的提取特征的方式，以及设计合适的相似度比较算法检测音频的复制粘贴篡改，不仅在篡改检测的准确度上有了很大提升，在定位上也有更优秀的表现，而且在检测经过后处理的音频文件上仍然有很好的鲁棒性。

一种智能电子听诊系统及方法-202310996489.1
发明人：皮喜田;张海燕;刘洪英;李吴优 -专利权人：重庆大学
申请日： 2023-08-09 - 公布日： 2023-10-20 - 主分类号： G10L25/06
摘要：本发明涉及电子听诊器技术领域，具体涉及一种智能电子听诊系统及方法。通过电子听诊装置同时对目标生理音和语音进行采集，获得音频信号，然后智能听诊终端和听诊云服务器对音频信号进行分析和处理，得到听诊报告，听诊报告中包含心肺音分析结果和语音随访分析结果，从而将听诊过程的环境音中有价值的声音信号提取出来，减轻听诊后期操作者的手动整理部分，节省听诊时间，提高便利性，避免了遗漏重要信息；另外针对听诊过程而言，本方案还提供了一套完整智能的系统或方法以处理或帮助听诊过程。

音频指纹特征提取模型的处理方法、装置和计算机设备-202311041995.1
发明人：袁有根;胡鹏飞 -专利权人：腾讯科技（深圳）有限公司
申请日： 2023-08-18 - 公布日： 2023-09-15 - 主分类号： G10L25/06
摘要：本申请涉及一种音频指纹特征提取模型的处理方法、装置和计算机设备。该方法涉及人工智能技术，方法包括：利用音频指纹特征提取模型，得到样本音频指纹特征、正样本音频指纹特征与负样本音频指纹特征；根据样本音频指纹特征与正样本音频指纹特征间的正样本相似度、样本音频指纹特征与负样本音频指纹特征间的负样本相似度，构建对比损失，根据样本音频指纹特征、正样本音频指纹特征分别与分界值间的差异，构建量化损失，根据正样本相似度，构建正样本趋同损失，联合对比损失、量化损失和正样本趋同损失调整模型参数，以得到训练好的音频指纹特征提取模型，提高音频匹配准确性。

应用于电力行业的语音识别方法、设备控制方法及系统-202310812347.5
发明人：段星辉;李沛奇;孙国繁;高宝明;段雨松;高晋文;马璇;周鑫 -专利权人：国网山西省电力公司超高压变电分公司
申请日： 2023-07-04 - 公布日： 2023-09-05 - 主分类号： G10L25/06
摘要：本申请实施例提供一种应用于电力行业的语音识别方法、设备控制方法及系统，包括：将待识别的语音信号转换为语音数字信号；提取出语音数字信号中的人声语音波信号；对人声语音波信号进行分帧处理，并提取每一帧人声语音波信号对应的音素特征向量；通过训练好的音素特征状态转移模型和最优路径算法，对每一帧人声语音波信号对应的音素特征向量进行识别，将相似度最高的语音样本作为识别字输出；具有语音识别精确度较高的有益效果，适用于语音识别的技术领域。

一种触屏声音检测方法和装置-201911043701.2
发明人：张晴晴;杨金富;岑吴镕;罗磊;马光谦;汪洋 -专利权人：北京爱数智慧科技有限公司
申请日： 2019-10-30 - 公布日： 2022-11-25 - 主分类号： G10L25/06
摘要：本发明公开一种触屏声音检测方法和装置，该方法包括以下步骤：获取用户通过触屏设备录制的音频信号；对所述音频信号与模板信号进行相关度分析，得到所述音频信号与所述模板信号之间的相关系数；根据所述相关系数确定所述音频信号是否包含触屏声音。本发明对模板信号以及通过触屏设备录制的音频信号进行相关度分析，从而确定音频信号是否包含触屏信号，提升了触屏信号检测的准确率。

一种音频定位方法、音频处理方法和音频处理系统-202010764665.5
发明人：邹李勇;刘咏辉 -专利权人：北京小米移动软件有限公司
申请日： 2020-07-31 - 公布日： 2022-02-18 - 主分类号： G10L25/06
摘要：本申请公开了一种音频定位方法、音频处理方法和音频处理系统，所述音频定位方法包括如下步骤：获取对标准音源信号进行录制得到录制音频信号；计算录制音频信号与标准音源信号的相关性；确定相关性最高的时间点为所述标准音源信号在所述录制音频信号中的位置。采用本申请的方案通过相关原理定位到了音源信号在整段录音中的位置，然后可以进行后续的信号处理。这样的方案取消了定位信号，不再依赖固定的定位信号；标准音源的频点可灵活配置，只要分析的频点连续即可单独提出定位；整段扫频信号进行相关定位，对标准音源信号的首尾质量无特殊需求。

非常短的基音周期检测和编码-201710342157.6
发明人：高扬;齐峰岩 -专利权人：华为技术有限公司
申请日： 2012-12-21 - 公布日： 2021-05-07 - 主分类号： G10L25/06
摘要：为用于语音或音频信号的非常短的基音周期检测和编码提供了系统和方法实施例。该系统和方法包括使用时域和频域基音周期检测技术的组合在语音或音频信号中检测是否存在比常规最小基音周期限制更短的非常短的基音周期。基音周期检测技术包括使用时域中的基音相关系数和检测频域中的语音或音频信号中的低频能量的缺少。使用开始于预定义最小的非常短的基音限制(小于常规最小基音限制)的基音周期范围对检测到的非常短的基音周期进行编码。

基音周期的确定方法、装置、计算机设备和存储介质-201810608431.4
发明人：袁念德;邵明绪;田姣 -专利权人：西安蜂语信息科技有限公司
申请日： 2018-06-13 - 公布日： 2020-12-04 - 主分类号： G10L25/06
摘要：本申请涉及一种基音周期的确定方法、装置、计算机设备和存储介质。所述方法包括：获取在预设的每个候选基音周期下，待测音频信号与每个偏移音频信号之间的归一化幅度差能量和自相关函数和；其中，所述偏移音频信号为所述待测音频信号按照所述候选基音周期偏移后得到的信号；对每个所述候选基音周期下的自相关函数和执行极值转换操作，获取每个所述候选基音周期下的自相关误差；所述极值转换操作用于将所述自相关函数和的极大值转换为极小值；根据每个所述候选基音周期下的归一化幅度差能量和自相关误差，确定目标基音周期。采用本方法能够提高基音周期的准确性。

一种基于静音段的异源音频拼接篡改盲检测方法-201710218327.X
发明人：胡永健;梁富文;刘琲贝;王宇飞 -专利权人：华南理工大学
申请日： 2017-04-05 - 公布日： 2020-11-24 - 主分类号： G10L25/06
摘要：本发明公开了一种基于静音段的异源音频拼接篡改盲检测方法。该方法包括如下步骤：对待测音频进行分帧与加窗；对音频帧频谱能量和过零率进行阈值判断，检测静音段；计算静音段音频特征；利用滑动窗口求取静音段上相邻静音帧音频特征相关系数向量；检测篡改点；确定篡改位置。本发明无需借助数字水印作为嵌入信息，针对时域上的异源音频拼接和插入操作，能有效判断篡改是否存在并定位具体篡改位置。

一种音频质量检测方法及音频质量检测系统-201710517195.0
发明人：宋扬;程兰颖;赵涛 -专利权人：数据堂（北京）科技股份有限公司
申请日： 2017-06-29 - 公布日： 2020-07-14 - 主分类号： G10L25/06
摘要：本申请公开了一种音频质量检测方法及音频质量检测系统，其中，所述音频质量检测方法通过计算各个通道采集的音频数据的相关性来获得各通道设备内音频异常检测结果；并且为了避免所述待检测设备所有通道出现同样的问题以及各种噪音导致的检测异常，所述音频质量检测方法通过获取参考设备的参考通道的音频数据，并根据参考通道的音频数据和目标通道的音频数据的相关性计算来获得设备间音频异常检测结果，并综合所述待检测设备各通道设备内音频异常检测结果和目标通道设备间检测结果综合生成音频检测报告，从而在实现了对多通道同步音频采集设备的音频质量的自动检测的基础上，增加了所述音频质量检测方法的鲁棒性。

语音处理装置和语音处理方法-201510566659.8
发明人：山本雅裕 -专利权人：株式会社东芝
申请日： 2015-09-08 - 公布日： 2016-03-30 - 主分类号： G10L25/06
摘要：根据实施例，提供语音处理装置和语音处理方法。语音处理装置包含分析器、特征量计算器、比较器和感觉指标计算器。分析器进行多个伪频率分析，每个伪频率分析对要被处理的对象语音使用不同的窗函数。特征量计算器基于多个伪频率分析的分析结果，来计算对象语音的特征量。比较器将对象语音的特征量与从基准语音计算出的基准特征量进行比较，并且产生比较结果。感觉指标计算器基于比较结果，来计算感觉指标，感觉指标表示从对象语音接收到的感觉。

检测口语考试作弊的方法及系统-201210590964.7
发明人：王士进;何婷婷;刘丹;胡国平;胡郁;刘庆峰 -专利权人：安徽科大讯飞信息科技股份有限公司
申请日： 2012-12-31 - 公布日： 2013-04-24 - 主分类号： G10L25/06
摘要：本发明涉及语音数据处理技术领域，公开了一种检测口语考试作弊的方法及系统。该方法包括：提取所有考生的考生语音数据，所述考生语音数据包括考试前的测试音数据和考题录音数据；根据所述考生语音数据确定各考生的疑似作弊数据集；根据所述考生的疑似作弊数据集对所述考生的考生语音数据进行复测，得到作弊检测结果。利用本发明，可以保证在监考阶段没有监考人员监测到，也可以在成绩发布之前进行快速、精确的作弊检测，保证口语考试的公平客观性。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种音频质量检测方法及音频质量检测系统有效

专利文献下载