[发明专利]用于发电系统的基于云的声学监测、分析和诊断在审

专利信息
申请号: 202111515552.2 申请日: 2021-12-13
公开(公告)号: CN114649002A 公开(公告)日: 2022-06-21
发明(设计)人: Q·H·阮;A·B·纳戈尔斯基;D·维努戈帕尔塞蒂;R·L·劳德;L·T·莫泰拉罗 申请(专利权)人: 通用电气公司
主分类号: G10L25/51 分类号: G10L25/51;G10L19/02;H04L67/10;G01H17/00
代理公司: 中国专利代理(香港)有限公司 72001 代理人: 李啸
地址: 美国*** 国省代码: 暂无信息
权利要求书: 暂无信息 说明书: 暂无信息
摘要: 发明题为“用于发电系统的基于云的声学监测、分析和诊断”。本发明公开了一种系统,该系统包括声学监测、分析和诊断系统,该声学监测、分析和诊断系统具有处理器。该处理器被配置为从近场(NF)麦克风阵列接收NF噪声信号,该NF麦克风阵列在NF中测量来自发电系统的噪声。该处理器被配置为从远场(FF)麦克风阵列接收FF噪声信号,该FF麦克风阵列在FF中测量来自发电系统的噪声。该处理器被配置为基于这些信号来导出NF噪声测量结果和FF噪声测量结果并且使NF噪声测量结果和FF噪声测量结果同步以创建同步NF噪声数据和同步FF噪声数据。该处理器被配置为分析同步NF噪声数据和同步FF噪声数据以创建NF噪声特征和FF噪声特征。该处理器被配置为诊断从该发电系统产生的噪声的根本原因并且报告这些根本原因。
搜索关键词: 用于 发电 系统 基于 声学 监测 分析 诊断
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于通用电气公司,未经通用电气公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202111515552.2/,转载请声明来源钻瓜专利网。

同类专利
  • 一种实时音频流的比对方法和系统-202210335546.7
  • 田野;彭建川;奚新明 - 北京澜灵科技有限责任公司
  • 2022-04-01 - 2022-06-28 - G10L25/51
  • 本发明涉及一种实时音频流的比对方法和系统,属于音频处理技术领域,解决了现有对音频的微小变化不敏感和识别灵敏度不高的问题。包括接收实时主备音频流,预处理后得到主备音频帧信号;对主备音频帧信号提取logfbank特征向量并转换为0‑1向量,得到待比对的主备音频帧指纹数据;将待比对的主备音频帧指纹数据分别加入主备队列中,依次通过初始匹配和连续匹配获取匹配帧,根据匹配帧的位置差得到延迟时间;其中初始匹配用于获取初始匹配帧;连续匹配根据初始匹配帧,获取待比对的音频对矩阵并依次比对,若获取到匹配帧则更新初始匹配帧,重新获取待比对的音频对矩阵并依次比对;否则更新主备队列,重新进行初始匹配。实现了鲁棒的高灵敏度音频比对。
  • 安防方法、终端设备及存储介质-201910091697.0
  • 陈飞;吴海全;迟欣;张恩勤;曹磊;师瑞文 - 深圳市冠旭电子股份有限公司
  • 2019-01-30 - 2022-06-28 - G10L25/51
  • 本申请适用于安全防护技术领域,提供了一种安防方法、终端设备及存储介质,其中,上述安防方法包括:获取环境声音,并提取环境声音的频谱特征;根据频谱特征识别环境声音是否包括预设的异常声音;当环境声音包括预设的异常声音时,发送安防报警信息。本申请实施例提供的安防方法、终端设备及存储介质,利用环境声音的频谱特征识别环境声音是否包括预设的异常声音,例如翻东西、物体坠落或撬锁等异常声音,从而实现了基于音频识别的室内安防报警。由于声音采集设备能够方便地隐蔽于家居环境或办公环境中,相较于传统的摄像监控方式,具有更好的隐蔽性,能够有效避免被蓄意破坏,从而提高了安防的可靠性。
  • 语音判别方法、装置、计算机设备、存储介质和程序产品-202210287556.8
  • 崔洋洋;余俊澎 - 游密科技(深圳)有限公司
  • 2022-03-23 - 2022-06-24 - G10L25/51
  • 本申请涉及一种语音判别方法、装置、计算机设备、存储介质和程序产品。该方法包括:获取目标通话过程的语音数据;将语音数据输入至预设的语音判别模型中,通过语音判别模型对语音数据的语义特征进行分析,得到语音数据的语音类型判别结果;语义特征至少包括声调特征、因素特征、间隔段落特征和声音频谱特征;语音类型判别结果包括合成语音或者真实语音。采用本方法能够提高合成语音识别准确度。
  • 锁相环警报检测-202111577637.3
  • G.巴拉钱德兰 - 伟摩有限责任公司
  • 2021-12-22 - 2022-06-24 - G10L25/51
  • 用于检测紧急警报的一个示例系统包括麦克风设备;带通滤波器,可操作地耦合到麦克风设备,并被配置为对来自麦克风设备的声音数据进行滤波以产生经滤波的声音数据;锁相环电路,被配置为对经滤波的声音数据进行相位滤波以产生经相位滤波的数据;以及处理器,被配置为从经相位滤波的数据确定警报信号的存在。
  • 语音采集自动停止的方法、装置、终端设备和存储介质-201911077811.0
  • 曹桐军 - 广州视源电子科技股份有限公司;广州视睿电子科技有限公司
  • 2019-11-06 - 2022-06-24 - G10L25/51
  • 本发明实施例公开了一种语音采集自动停止的方法、装置、终端设备和存储介质。该方法包括:显示文字语料,所述文字语料用于语音测试;接收开始指令,所述开始指令用于触发采集得到用于语音测试的音频数据;提取采集到的音频数据的频率特征;当所述频率特征满足预设的特征模型,或采集到的音频数据达到所述文字语料的对应时长时,停止采集音频数据。被测者或者参与测评的工作人员在测试开始后无需对语音采集过程进行手动控制,简化了基于机器测试的语音测试过程中用户的交互操作,尤其对于被测者自行控制的测试过程中,可以专注于根据文字语料进行语音表达,不用分散精力进行测试过程中的各种中断控制或者结束控制。
  • 基于对象识别的美音方法、电子设备及存储介质-202110726914.6
  • 刘镇亿;玄建永;高海宽 - 北京荣耀终端有限公司
  • 2021-06-29 - 2022-06-24 - G10L25/51
  • 本申请涉及视频优化领域,提供了一种基于对象识别的美音方法、电子设备及存储介质。所述基于对象识别的美音方法包括:获取视频对应的图像流数据和音频流数据;识别所述图像流数据,确定图像对象;识别所述音频流数据,确定音频对象;根据所述图像对象和所述音频对象,确定待处理音频对象和所述待处理音频对象对应的处理规则;按照所述处理规则对所述待处理音频对象进行处理,得到处理后的音频数据;将所述图像流数据与所述处理后的音频数据进行拼接,得到处理后的视频数据。利用本申请实施例,可以提高视频中的音频美化的效率,从而提高视频的质量。
  • 用于发电系统的基于云的声学监测、分析和诊断-202111515552.2
  • Q·H·阮;A·B·纳戈尔斯基;D·维努戈帕尔塞蒂;R·L·劳德;L·T·莫泰拉罗 - 通用电气公司
  • 2021-12-13 - 2022-06-21 - G10L25/51
  • 本发明题为“用于发电系统的基于云的声学监测、分析和诊断”。本发明公开了一种系统,该系统包括声学监测、分析和诊断系统,该声学监测、分析和诊断系统具有处理器。该处理器被配置为从近场(NF)麦克风阵列接收NF噪声信号,该NF麦克风阵列在NF中测量来自发电系统的噪声。该处理器被配置为从远场(FF)麦克风阵列接收FF噪声信号,该FF麦克风阵列在FF中测量来自发电系统的噪声。该处理器被配置为基于这些信号来导出NF噪声测量结果和FF噪声测量结果并且使NF噪声测量结果和FF噪声测量结果同步以创建同步NF噪声数据和同步FF噪声数据。该处理器被配置为分析同步NF噪声数据和同步FF噪声数据以创建NF噪声特征和FF噪声特征。该处理器被配置为诊断从该发电系统产生的噪声的根本原因并且报告这些根本原因。
  • 真实世界音频训练数据的自动挖掘-201980102128.X
  • 多米尼克·罗博列克 - 谷歌有限责任公司
  • 2019-11-18 - 2022-06-21 - G10L25/51
  • 用于为机器学习生成标记的训练样本的方法、系统和装置。在一个方面中,一种方法包括由用户设备接收音频记录集合。对于每个音频记录集合,该集合中的每个音频记录在特定时间间隔期间通过所述用户设备中的相应的单独的麦克风记录,并且每个特定时间间隔对于每个音频记录集合不同。对于每个音频记录集合,检测器确定该音频记录集合中的音频记录是否包括特定音频特征,并且所述音频记录中的另一音频记录是否不包括所述特定音频特征。对于被确定为包括含有所述特定音频特征的音频记录和包括不含有所述特定音频特征的另一音频记录的每个音频记录集合,生成标记的训练样本。
  • 端到端的智能语音朗读评测方法-202010627043.8
  • 张展;王曰海 - 浙江大学绍兴微电子研究中心;浙江大学;绍兴市科技创业投资有限公司
  • 2020-07-02 - 2022-06-21 - G10L25/51
  • 本发明公开了端到端的智能语音朗读评测方法,包括:收集用于训练评测神经网络的朗读语音、目标发音、错误代码、说话人信息的数据处理流程;针对说话人特征,对评测神经网络进行辅助训练;根据待评测的目标发音与待评测发音,直接由神经网络端到端输出评测结果,从输入目标发音与待评测发音,到输出评测结果,整个流程可微分,可直接针对评测指标进行优化。本发明直接构建输入为语音和待评测文本、输出为反馈结果的端到端评测模式,可与方法中的各个模块联合训练使得整体效果更好,另外该方法构建的辅助任务能够更准确的提取评测相关特征,使得反馈的评测结果更为准确。
  • 一种基于卷积神经网络关系建模的环境声音分类方法-202110679471.X
  • 韩纪庆;宋宏伟;郑贵滨;郑铁然 - 哈尔滨工业大学
  • 2021-06-18 - 2022-06-21 - G10L25/51
  • 一种基于卷积神经网络关系建模的环境声音分类方法,本发明涉及基于卷积神经网络关系建模的环境声音分类方法。本发明的目的是为了解决现有方法对环境声音分类准确性低的问题。过程为:一、对采集的环境声音的音频提取对数声谱图,分为训练集和测试集;二、构建环境声音分类模型;三、将训练集输入环境声音分类模型进行训练,得到预训练好的环境声音分类模型;四、将测试集输入预训练好的环境声音分类模型,若准确率达到要求,得到训练好的环境声音分类模型,执行五;否则,重复执行三和四,直至得到训练好的环境声音分类模型;五、将待识别的声音信号输入训练好的环境声音分类模型,得到待识别的声音信号的类别。本发明用于环境声音分类领域。
  • 演奏效果评估方法、装置、电子设备及存储介质-202210328512.5
  • 王新宇;王宇航;曾鹏轩 - 北京思明启创科技有限公司
  • 2022-03-30 - 2022-06-17 - G10L25/51
  • 本申请实施例提供一种演奏效果评估方法、装置、电子设备及存储介质,方法包括:获取待评价音频对应的音符序列;所述音符序列为对所述待评价音频中的每一个音频信号进行识别后,得到的由各所述音频信号对应识别出的音符构成的序列;采用隐马尔可夫模型对所述音符序列进行处理,得到所述音符序列对应的目标音簇序列;所述目标音簇序列为所述音符序列在标准曲谱中最大概率对应的音簇序列;所述标准音簇序列为按照演奏顺序对所述标准曲谱进行划分后得到的音簇序列;将所述目标音簇序列与所述标准曲谱的标准音簇序列进行比对,得到所述待评价音频的评价结果,以此提高评估演奏音频效果的准确性。
  • 一种虚拟演奏伙伴的实现方法和装置-202210329134.2
  • 严子恒;俞江;金鑫;陈洁;苏维扬;陈有鑫;吴龙海 - 三星电子(中国)研发中心;三星电子株式会社
  • 2022-03-30 - 2022-06-17 - G10L25/51
  • 本申请公开了一种虚拟演奏伙伴的实现方法,包括:以音频帧为单位,采集演奏者演奏的音频帧数据;对于采集的每一个当前音频帧数据,将所述当前音频帧数据转换为当前数字乐谱,并与演奏曲目中指定范围的数字乐谱进行匹配,确定所述指定范围的数字乐谱中与所述当前数字乐谱匹配的匹配数字乐谱;定位所述匹配数字乐谱在演奏曲目中的位置,并确定所述演奏伙伴对所述演奏曲目中在所述匹配数字乐谱下一小节合作部分乐曲的开始播放时间;根据所述当前数字乐谱的演奏时间和所述匹配数字乐谱的演奏时间,确定所述演奏者与演奏伙伴的演奏误差,根据所述演奏误差,调节所述演奏伙伴对于所述演奏曲目合作部分的播放速度。应用本申请,能够使乐曲播放适应演奏者的演奏进度,改善演奏者的演奏体验。
  • 音频处理方法、装置、电子设备及存储介质-202210239161.0
  • 钟嘉禧;吕子谋;常智 - 深圳追一科技有限公司
  • 2022-03-11 - 2022-06-17 - G10L25/51
  • 本申请公开了一种音频处理方法、装置、电子设备及存储介质,应用于音频处理系统,该系统包括相互连接的第一终端和第二终端,以及与所述第一终端相连的处理终端。通过在第一终端中根据预先获取的用于表示第二终端的音频属性的预设音频参数将用户的原始音频数据转换为目标音频数据,即使第一终端与第二终端的音频属性不一致,也可以实现语音通话,并且通过调整预设音频参数还可以使第一终端与支持任意音频属性的第二终端进行语音通话,因此在处理终端对语音通话的过程进行预设处理时,可以实现对不同音频属性的通话终端之间语音通话过程的分析和处理,不仅丰富了语音通话的使用场景,还提升了语音通话调试和验证的灵活性。
  • 一种用于工厂的监控安防系统-202110343685.X
  • 黄瑶瑶;武承哲;王秉相 - 浙江安防职业技术学院
  • 2021-03-30 - 2022-06-17 - G10L25/51
  • 本发明提出了一种用于工厂的监控安防系统,其在无线传感器网络的基础上,提出了针对水循环系统的监控方案,以便能够实现对水循环系统的实时有效监控,同时对尤其是大范围的监控场景下的无线传感器监控网络提出了一种控制方案,其中能够允许各个传感器独立控制其工作状态,无需设置中央控制器进行统一管理,可以有效避免大量控制数据占用有限的无线带宽资源,并且可以有效减少各传感器的工作时间,减少系统能耗,改善系统的生命周期。
  • 一种可视化智能终端语音诊断的方法-202011304860.6
  • 黄涛涛;高美军;李洋全;陈贵凤;陈新 - 四川长虹电器股份有限公司
  • 2020-11-19 - 2022-06-17 - G10L25/51
  • 本发明公开了一种可视化智能终端语音诊断的方法,在语音交互过程中同步保存语音信息的具体流程,对智能终端语音异常进行诊断,诊断方法包括:进入语音诊断界面,判断语音程序是否运行;获取最近一次语音信息;根据所获取的最近一次语音信息,判断异常原因,对异常原因按照语音交互过程进行分步式判断,所述分布式判断包括依次对语音交互过程进行判断,得到异常信息。通过本发明的方法通过跨进程交互规则,获取语音交互信息,通过分析语音交互过程是否执行,执行是否有异常信息确定语音的异常原因,从而实现语音异常的快速、准确定位。
  • 基于深度卷积神经网络的钢琴弹奏音乐错误识别方法-202210214141.8
  • 巢李冰;杨志国;郭玲 - 南京理工大学
  • 2022-03-04 - 2022-06-14 - G10L25/51
  • 本发明公开了一种基于深度卷积神经网络的钢琴弹奏音乐错误识别方法,包括:创建网络训练数据集;构建深度卷积神经网络模型,并进行迭代训练;拆分并保存训练好的深度卷积神经网络模型与权重;录音并进行音频分割,生成声谱图作为深度卷积神经网络模型的输入,获取分类识别结果;读取midi文件中的音高信息作为检测标准与识别结果进行对比,显示对比结果。本发明设计的轻量型深度神经网络模型,能够在安卓系统运行本地,避免了应用客户端与服务端的数据传输,识别准确率高、响应快。
  • 声学场景分类模型训练方法、装置、智能终端及存储介质-202210319713.9
  • 谭钦;王佳旭;苗健彰 - 大象声科(深圳)科技有限公司
  • 2022-03-29 - 2022-06-14 - G10L25/51
  • 本发明公开了声学场景分类模型训练方法、装置、智能终端及存储介质,所述方法包括:获取训练数据;提取所述样本音频的第一特征信号,并将所述第一特征信号进行切片和扩容后得到第二特征信号;将所述第二特征信号输入声学场景分类模型,输出预测声学场景类别;其中,所述声学场景分类模型通过对残差神经网络进行改进得到;根据所述预测声学场景类别和所述真实标签对所述声学场景分类模型进行训练,以得到已训练的声学场景分类模型。本发明实施例中通过对样本音频的特征信号进行切片后扩容,使得输入样本信号尺寸减小,并提升响应速度;将样本信号输入到改进的残差神经网络进行训练,使得模型的分类结果准确率更高。
  • 语音评测方法、装置、设备及存储介质-202210325744.5
  • 何梦中;李秀林;吴本谷 - 标贝(北京)科技有限公司
  • 2022-03-29 - 2022-06-14 - G10L25/51
  • 本发明提供了一种语音评测方法、装置、设备及存储介质。方法包括:获取待评测的音频信号;提取音频信号中每个语音帧的声学特征;利用声学特征确定音频信号的语音帧发音为音素字典中的各个音素的概率,以获得语音帧的发音信息;基于方言字典,确定标准文本信息对应的音素,其中方言字典中的字的音素包括标准音素和方言音素;基于音频信号中每个语音帧的声学特征和发音信息,将音频信号的语音帧和标准文本信息对应的音素对齐,以获得语音帧的对齐信息;以及根据语音帧的发音信息和对齐信息,确定音频信号相对于标准文本信息的评测结果。由此,能够有效地扩大语音评测技术的使用范围,进而能够满足用户的多种需求,提升用户的体验。
  • 基于深度学习网络的钢琴乐音分割及音符识别算法-202210209245.X
  • 兰智杰;张丹阳;郭玲 - 南京理工大学
  • 2022-03-03 - 2022-06-14 - G10L25/51
  • 本发明公开了一种基于深度学习网络的钢琴乐音分割及音符识别算法,包括步骤:基于循环神经网络,从一段连续的钢琴音频中得到每个单音的起始点;根据每个单音的起始点,将完整的钢琴音频信号分割为若干个单音音频;构建音高识别的音频数据集;对音频数据集中的信号进行预处理,绘制变换后的语谱图,同时依据各基频的频带对语谱图进行分割得到子语谱图;将语谱图分割得到的多个子语谱图作为输入,通过多个卷积神经网络进行音高的识别。本发明相较于传统的时域方法,不再依赖阈值的选取,提高了泛化能力,相较于传统的频域方法,简化了计算过程,提高了运行速度。
  • 一种声音信号处理方法及装置-201910715952.4
  • 鲁霄 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2019-08-01 - 2022-06-14 - G10L25/51
  • 本发明实施例公开了一种声音信号处理方法及装置,该方法包括:根据多个歌星的声音样本生成所述多个歌星中每个歌星的声音向量,其中,任意一个歌星的声音向量为对所述任意一个歌星的声音样本的量化;接收用户输入的目标声音信号;对所述目标声音信号进行量化以得到目标声音向量;确定所述多个歌星的声音向量中与所述目标声音向量的相似度满足预设条件的N个歌星的声音向量,其中,N为大于或者等于1的正整数;输出提示信息,其中,所述提示信息用于提示所述用户适合唱所述N个歌星主唱的歌曲。采用本发明实施例,能够快速帮助用户查找适合其歌唱的歌曲。
  • 教学环境安全分析方法-201911061807.5
  • 田雪松;陈天 - 广州云蝶科技有限公司
  • 2019-11-01 - 2022-06-14 - G10L25/51
  • 本发明提供了一种教学环境安全分析方法,包括:获取第一预设时长内,第一教学场地的课堂视音频数据;对课堂授课视音频数据进行语音特征提取;根据提取结果,判断课堂授课视音频数据中是否存在限制性语言;当存在限制性语言时,生成第一提示信息;根据课堂听课视音频数据,获取情绪信息;根据情绪信息,获取异常学生个体的个数;获取环境信息参数;根据异常学生个体的个数和对应的环境信息参数,判断环境信息参数对异常学生个体的个数是否存在影响。由此,实现了对教学环境中的语言暴力、教学场地的环境条件的检测,实现了对教学环境的安全进行分析,以便于对不良的环境进行改善,从而提高教学效果。
  • 一种音乐教学方法及系统-202210186147.9
  • 林东姝 - 杭州小伴熊科技有限公司
  • 2022-02-28 - 2022-06-10 - G10L25/51
  • 一种音乐教学方法,包括以下步骤:获取音乐片段;提取音频,绘制频谱;降噪处理,重新绘制频谱;端点检测,乐音分割;给出音乐评价。一种音乐教学系统,包括存储模块、语音模块、处理模块以及分析模块;语音模块用于录制学生歌唱的一段乐音以及播放音乐评价;存储模块用于储存学生上传的含有乐音的文件以及保存处理模块处理过后的文件和频谱;处理模块用于提取音频、绘制频谱,降噪处理、重新绘制频谱以及点检测、乐音分割;分析模块用于分析处理模块处理过后的文件以及频谱,并给出评价。语音模块还可以实现教师与学生之间的教学互动。降低教师与学生教学过程中的交互性要求,提高学生的自主学习能力。
  • 一种人工智能检测系统、方法和计算机程序-202111460901.5
  • 沈增辉 - 北京中科智易科技有限公司
  • 2021-12-03 - 2022-06-10 - G10L25/51
  • 本发明提供一种人工智能检测系统、方法和计算机程序,属于人工智能技术领域。该方法包括:获取设置于待检测的机械装备上或附近预设区域内的声音采集装置采集的声音信息;将声音信息分割成预设时长的信息单元;针对每一信息单元,将信息单元按照时间、频率和/或幅度划分成多个信息块;针对每一信息块,获取信息块的第一评分,第一评分用于指示信息块对破裂检测的有效程度;获取每一信息单元中的目标信息块,并将根据目标信息块得到的目标信息输入至机械装备破损检测模型中检测机械装备是否破裂,目标信息块的第一评分大于第一预设值。本发明提供的机械装备破损检测方案不依赖于人工经验、准确率高,而且可以实时检测、不需要在特定的时间检测、效率高。
  • 基于重复旋律的音乐分段边界识别方法-202010459989.8
  • 张克俊;朱凯丽;殷叶航;叶雨晴;伍文棋;王昊阳 - 浙江大学
  • 2020-05-26 - 2022-06-10 - G10L25/51
  • 本发明涉及一种基于重复旋律的音乐分段边界识别方法,属于音频信号处理技术领域。包括:1)对音频提取chroma特征,首尾零填充,聚合每相邻的N帧形成新的帧向量,所有帧向量构成新的帧特征向量序列;2)计算帧特征序列中每个帧向量与其他帧向量的欧氏距离,得到自相似矩阵S;3)基于自相似矩阵S,得到第i个帧向量最近邻帧的集合Ni,并得到自相似矩阵S的递归图R;4)将递归图R经时间延迟处理,得到时间延迟矩阵L;5)对L进行线段规整及去噪,再反时间延迟处理得到递归图R’;6)检测出所有的线段并进行线段聚簇,从线段最多的簇开始依次处理,得到音乐分段边界点集合B。可提升对音乐中重复旋律的识别能力,在更短时长内对音乐进行分段。
  • 基于音频分析的护理识别评价方法-202010702815.X
  • 翟振刚;陆晓英;陈媛;周姝妍;顾哲航 - 浙江嘉科智慧养老服务有限公司
  • 2020-07-18 - 2022-06-10 - G10L25/51
  • 本发明公开了一种基于音频分析的护理识别评价方法,包括步骤S1:语音识别器接收待检测的服务播报音频,将语音识别器识别获得的文本识别结果输入服务类型匹配器并且导出对应的服务类型判决器,以确定后续的服务类型;步骤S2:标志音效分类器接收待检测的服务内容音频,并且输入服务类型判决器,以获得最终的服务内容音频所属的服务类型的判决结果。本发明公开的一种基于音频分析的护理识别评价方法,在保护被护理人如失去生活自理能力、患病人员或老年人隐私的前提下,自动监测人工护理服务质量。
  • 音频节拍检测方法、装置及存储介质-201811278954.3
  • 王征韬 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2018-10-30 - 2022-06-10 - G10L25/51
  • 本发明公开了一种音频节拍检测方法、装置及存储介质,所述方法包括:获取训练样本,并对所述训练样本进行特征提取,以提取出所述训练样本的音频特征,再将所述训练样本的音频特征输入参考模型中进行学习训练,以得到训练后的所述参考模型的优化参数,且根据所述优化参数生成检测模型,然后基于所述检测模型对待测音频进行音频节拍检测,以获取所述待测音频的BPM值以及所述BPM值对应的置信度,提升了音频节拍检测的准确率,且能缩短检测过程中的运行时间。
  • 一种虚假语音的检测方法、装置、电子设备及存储介质-202210297859.8
  • 孟凡芹;郑榕 - 北京远鉴信息技术有限公司
  • 2022-03-25 - 2022-06-07 - G10L25/51
  • 本申请提供了一种虚假语音的检测方法、装置、电子设备及存储介质,方法包括:获取待检测语音;将待检测语音输入语音检测模型的嵌入特征提取网络层,确定出全频带语音特征和多个子频带语音特征;将全频带语音特征和多个子频带语音特征输入组合注意力网络层,确定出全频带局部特征以及多个子频带局部特征;其中,全频带局部特征和子频带局部特征均是在至少一个注意力维度上进行特征提取确定的;将全频带局部特征和多个子频带局部特征输入融合注意力网络层,确定出目标语音融合特征;基于目标语音融合特征,确定出待检测语音是否为虚假语音。通过直接将待检测语音输入语音检测模型中在不同注意力维度上进行全频带和子频带的语音特征提取,从而可以提高对虚假语音识别的准确率。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

tel code back_top