[发明专利]一种信号处理方法及装置在审

专利信息
申请号: 201810669024.4 申请日: 2018-06-26
公开(公告)号: CN109192226A 公开(公告)日: 2019-01-11
发明(设计)人: 丁惠君;潘搌鹏;岑乾;但果;汪天富;陈思平 申请(专利权)人: 深圳大学
主分类号: G10L25/66 分类号: G10L25/66;G10L25/51;G10L25/03
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 郝传鑫;熊永强
地址: 518000 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明实施例提供了一种信号处理方法及装置,包括:通过麦克风采集检测声音信号;通过目标网络模型识别该检测声音信号属于每类信号的概率;将该检测声音信号归类至识别出的概率最大的信号类。本发明实施例,可以通过非接触式检查嗓音疾病。
搜索关键词: 信号处理 非接触式检查 麦克风 采集检测 模型识别 目标网络 嗓音疾病 检测 概率 归类
【主权项】:
1.一种信号处理方法,其特征在于,包括:通过麦克风采集检测声音信号;通过目标网络模型识别所述检测声音信号属于每类信号的概率;将所述检测声音信号归类至所述概率最大的信号类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810669024.4/,转载请声明来源钻瓜专利网。

同类专利
  • 一种基于音频技术的肉鸡呼吸道疾病自动识别装置-201910600724.2
  • 沈明霞;许志强;刘龙申;孙玉文;陆明洲;姚文;赵茹茜;薛鸿翔;张伟;庄超 - 南京农业大学
  • 2019-07-04 - 2019-11-12 - G10L25/66
  • 本发明公开了一种基于音频技术的肉鸡呼吸道疾病自动识别装置,其特征在于它包括音频采集装置、传输装置、处理装置、预警装置,音频采集装置采集整个鸡舍的实时音频数据,音频数据基于传输装置输入处理装置,处理装置发送处理结果至预警装置。本装置对肉鸡呼吸道异常声音进行实时监测,多节点设计的群智感知方法可以保证数据来源的可靠性、完整性,wifi传输介质可以实现远程控制、灵活布局,web端软件可以实时、直观的反应肉鸡呼吸道异常声监测情况,方便鸡场管理人员及时发现异常并作出应对。
  • 一种皮肤采音设备-201920029010.6
  • 李祖辉;李屹帆 - 李祖辉
  • 2019-01-08 - 2019-09-27 - G10L25/66
  • 本实用新型提供了一种皮肤采音设备,属于声音检测技术领域。它解决了现有的无法进行日常嗓音检测的问题。本皮肤采音设备,包括能够隔音的壳体和设置在壳体内的麦克风主体,壳体上还设有供声音透过被麦克风主体采集的采音区;壳体上设置有能够与皮肤粘贴固定的粘贴片。本设备能够实现对日常嗓音进行检测并为用嗓行为和发音耐力评估提供能够描述日常发音特点的客观参数这一目标。
  • 建立阿兹海默症检测模型的方法和装置-201910059489.2
  • 刘博卿;贾雪丽;王健宗 - 平安科技(深圳)有限公司
  • 2019-01-22 - 2019-05-14 - G10L25/66
  • 本申请提供了一种建立阿兹海默症检测模型的方法和装置,包括:获取样本用户的多个样本语音说话段和所述样本用户的阿兹海默症检测结果,所述多个样本语音说话段中的每个样本语音说话段包括所述样本用户对样本图像的一段语音描述,所述阿兹海默症检测结果包括患病或未患病;对所述每个样本语音说话段进行特征提取,得到所述每个样本语音说话段的音频特征;根据所述每个样本语音说话段的音频特征、所述样本用户的阿兹海默症检测结果和卷积神经网络模型,建立所述阿兹海默症检测模型,所述阿兹海默症检测模型用于表示音频特征和阿兹海默症检测结果之间的映射关系。采用本申请提供的方法和装置,能够得到有效检测是否患有阿兹海默症的检测模型。
  • 一种皮肤采音设备和日常嗓音检测方法-201910015324.5
  • 李祖辉;李屹帆 - 李祖辉
  • 2019-01-08 - 2019-05-03 - G10L25/66
  • 本发明提供了一种皮肤采音设备和日常嗓音检测方法,属于声音检测技术领域。它解决了现有的无法进行日常嗓音检测的问题。本皮肤采音设备,包括能够隔音的壳体和设置在壳体内的麦克风主体,壳体上还设有供声音透过被麦克风主体采集的采音区;壳体上设置有能够与皮肤粘贴固定的粘贴片。本日常嗓音检测方法,包括以下步骤:a、设定记录时长,皮肤采音设备采集受检者日常嗓音的经皮信息并实时存储到移动存储设备中;b、对存储的日常嗓音信息进行分析、计算,得出受检者日常发音的发音时长和/或发音段数和/或日发音时长。本设备和方法能够实现对日常嗓音进行检测并为用嗓行为和发音耐力评估提供能够描述日常发音特点的客观参数这一目标。
  • 基于语音个性特征和模型自适应的驾驶疲劳检测方法-201610338429.0
  • 李响 - 华东交通大学
  • 2016-05-19 - 2019-04-30 - G10L25/66
  • 本发明提出了一种基于语音个性特征和模型自适应的驾驶疲劳检测方法。包含以下步骤:首先,提取驾驶人语音样本的线性特征和非线性特征;其次,采用基于VQ的说话人识别算法判别驾驶人身份;随后,根据驾驶人的个体疲劳特征差异,采用Relief算法筛选出能够充分反映其疲劳信息的语音特征,构建疲劳个性特征向量;最后,采用SVM分类算法建立驾驶人个体的自适应疲劳检测模型,并对模型进行样本训练以及驾驶疲劳检测。本发明将语音线性特征和非线性特征进行互补结合,同时针对驾驶人的个体差异,从中筛选出能够充分反映驾驶人疲劳信息的语音个性特征用于驾驶疲劳检测,有效降低了驾驶人个体发音差异对疲劳检测的影响,提高了检测的准确性。
  • 一种基于深度语音特征的脑卒中风险预测方法-201811571779.7
  • 陈鸥宇;刘怡俊;叶武剑;牟志伟;李琪 - 广东工业大学
  • 2018-12-21 - 2019-04-02 - G10L25/66
  • 本发明公开了一种基于深度语音特征的脑卒中风险预测方法,将语音处理与深学习技术应用到脑卒中检测过程中,采集人们的特定语音片段进行特定语音预处理后,用深度学习技术提取语音片段的深度特征信息,挖掘出高风险人群与普通人群语音的深层区别,从而构建出语音识别模型,对脑卒中患病风险进行评估与预测。本发明具有脑卒中预测准确率高、预测脑卒中的信息容易获取、预测代价非常小、方便快捷等优点。
  • 一种病理嗓音的检测系统-201310713471.2
  • 刘珊珊;燕楠;王岚;王知践 - 中国科学院深圳先进技术研究院
  • 2013-12-20 - 2019-03-01 - G10L25/66
  • 本发明适用于嗓音检测技术领域,提供了一种病理嗓音的检测方法,包括以下步骤:采集待检测病人的语音;将采集到的语音信号进行特征参数的提取和选择;将优化的参数进入构建好的分类器模型进行障碍等级评估;输出检测到的嗓音障碍分级结果。本发明使用计算机以及科学的评断标准,采用专业的语音处理算法,能够部分或者完全代替医生对患者进行诊断,其结果作为医生的诊断参考,最大程度的降低了诊断过程的偶然性。另外,本发明操作简单,使用方便,诊断正确率高,一般的医务人员通过简单培训均可掌握,一定程度上弥补了偏远地区及小城市医疗资源的不足,使患者可以就近确诊疾病,尽早治疗。再者,本发明为嗓音障碍提供了一种明确的、量化的分级方式,在病人治疗过程中的每个阶段都有相应的数据记载,医生通过这些数据可以完全跟踪了解病情,最大程度保障患者治疗过程。
  • 基于深度学习的咳嗽监测方法及装置-201811259953.4
  • 彭话易;蔡元哲;黄章成;王健宗;肖京 - 平安科技(深圳)有限公司
  • 2018-10-26 - 2019-02-19 - G10L25/66
  • 本公开涉及人工智能技术领域,揭示了一种基于深度学习的咳嗽监测方法及装置,包括:对采集的音频数据进行预处理得到若干帧音频序列;对所述若干帧音频序列进行咳嗽识别,以确定所述音频数据是否为咳嗽音频;以及对所述若干帧音频序列进行声纹识别,以确定所述音频数据的发声者;如果所述音频数据为咳嗽音频,则根据所述音频数据对所述发声者的咳嗽监测数据进行更新处理。采用深度学习的方法对音频数据进行咳嗽识别和声纹识别,从而得到音频数据对应发声者的咳嗽监测数据,实现了对咳嗽的自动监控,方便快捷,不需要专人进行咳嗽监测,提高了咳嗽监测的效率,保证了咳嗽监测数据的实时性。
  • 特定声音识别方法、设备和存储介质-201780009004.8
  • 刘洪涛;王伟;孟亚彬 - 深圳和而泰智能控制股份有限公司
  • 2017-10-24 - 2018-12-21 - G10L25/66
  • 一种特定声音识别方法、设备和存储介质,该方法包括:采样声音信号并获取所述声音信号的梅尔频率倒谱系数特征参数矩阵(201);从该声音信号的梅尔频率倒谱系数特征参数矩阵中提取特征参数(202);将特征参数输入预先获取的基于深度神经网络的特定声音特征模型进行识别,以确认该声音信号是否为特定声音(203)。该方法和设备采用基于MFCC特征参数和深度神经网络模型的识别算法,算法复杂度低、计算量少,从而对硬件要求低,降低了产品制造成本。
  • 一种基于声音特征的自主神经功能参数获取方法-201810783926.0
  • 张建保;李濛君;刘彬彬 - 西安交通大学
  • 2018-07-17 - 2018-12-18 - G10L25/66
  • 本发明公开了一种基于声音特征的自主神经功能参数获取方法,通过进行应激刺激实验并记录刺激前及刺激过程中被测试者的语音信号;然后对采集的语音信号静音切除、预加重、分帧和加窗预处理;最后利用对预处理后的语音信号进行参数计算,通过自相关函数获取声音的基频,得到每个被测试者语音信号的基频以及标准差数据,然后对该频率范围进行积分,得到基频功率,通过基频和基频功率实现自主神经功能的评价,基频可作为评价副交感神经的有效指标;基频功率可作为评价交感神经的有效指标;相比于其他生理指标,语音信号具有采集便捷,语音处理系统适应性强和技术成熟等特点,应用此方法能够更加快速,有效地评价自主神经功能变化。
  • 一种评测语言状态的方法及装置-201810573229.2
  • 姜涵予 - 姜涵予
  • 2018-06-06 - 2018-11-23 - G10L25/66
  • 本申请提供了一种评测语言状态的方法及装置,其中,该方法包括:获取语言评测方案;基于所述语言评测方案,向用户输出引导指令,并采集用户响应引导指令所作出的响应行为;语言评测方案是根据用户基础信息确定的,所述用户基础信息包括以下的至少两个:年龄、性别、身高和体重;根据用户的响应行为,确定用户的评测结果;所述评测结果包括以下至少一个结果:能否说话、口语表达及理解是否障碍。本申请实施例通过生成语言评测方案,分析用户语言评测结果,以此判定儿童是否发育正常以及被检测人是否存在语言障碍。
  • 一种基于深度音频特征的构音障碍严重程度估计方法-201810223054.2
  • 李鹏乾;李艳雄;李锦彬 - 华南理工大学
  • 2018-03-19 - 2018-09-28 - G10L25/66
  • 本发明公开了一种基于深度音频特征的构音障碍严重程度估计方法,包括:提取声学特征;将上述声学特征输入带瓶颈层的深度神经网络,从瓶颈层提取深度音频特征;将上述深度音频特征作为输入,采用Baum‑Welch算法训练的隐马尔可夫模型;最后将测试语音样本的深度音频特征依次输入上述训练好的四个隐马尔可夫模型,采用Viterbi算法得到四个输出概率,输出概率最大的模型所对应的类别也就是构音障碍严重程度即为判决结果。本发明采用的深度音频特征是一种深层变换特征,相比于传统声学特征能更有效刻画构音障碍语音的特性差异,在构音障碍严重程度估计中可以获得更加优异的效果。
  • 一种声带恢复评分方法及装置-201810045029.X
  • 晏青 - 广州势必可赢网络科技有限公司
  • 2018-01-17 - 2018-07-10 - G10L25/66
  • 本发明提供了一种声带恢复评分方法及装置,解决了现有的通过电子喉镜做恢复检查会使病人十分痛苦,且病人主观也很难描述声带的恢复情况的技术问题,其中方法包括:获取病人在恢复状态下的测试音频;提取所述测试音频中的第一语音特征参数;利用所述第一语音特征参数训练以建立第一UBM模型,并得到恢复状态下的声纹特征矢量;获取数据库中的健康状态下的声纹特征矢量;通过概率线性判别分析得到恢复状态下的声纹特征矢量和数据库中的健康状态下的声纹特征矢量的相似度;将所述相似度进行归一化处理,确定所述相似度的区间范围;根据所述相似度的区间范围得到病人在恢复状态下的得分。
  • 一种基于语音特征非负矩阵分解的阿尔茨海默症初筛方法-201810140213.2
  • 李艳雄;张聿晗;李先苦 - 华南理工大学
  • 2018-02-11 - 2018-06-22 - G10L25/66
  • 本发明公开了一种基于语音特征非负矩阵分解的阿尔茨海默症初筛方法,包括以下步骤:从阿尔茨海默症患者和正常人的语音样本中提取声学特征,包括基频、能量、谐噪比、共振峰、声门波、线性预测系数、常Q倒谱系数,并将上述特征拼接成一个特征矩阵;采用非负矩阵分解算法对上述特征矩阵进行分解,得到降维后的特征矩阵;将上述降维后的特征矩阵作为输入,训练支持向量机分类器;将测试语音样本的降维后的特征矩阵输入训练好的支持向量机分类器,判决测试语音是正常人语音还是阿尔茨海默症患者语音。本发明采用非负矩阵分解对高维输入声学特征进行降维变换处理,降维后的特征矩阵具有更好的区分性,在阿尔茨海默症初筛中可以获得更加优异的效果。
  • 一种基于语音特征的可穿戴设备监测心理健康方法-201711431278.4
  • 高斌;蒋龙 - 四川沐迪圣科技有限公司
  • 2017-12-26 - 2018-06-12 - G10L25/66
  • 本发明公开了种基于语音特征的可穿戴设备监测心理健康方法,先利用MEMS硅晶麦克风采集左右声道的音频信号,利用音频专用传感器WM8978对左右声道的语音信号进行放大和ADC转换,传输给可穿戴设备上的微控制器STM32F405,接着将原始语音信号按照WAV格式保存为语音文本,接着利用微控制器STM32F405的DSP离散数据信号处理模块对语音文本进行短时能量、谱熵、语音亮度和共振峰这4个语音特征进行语音特征提取,在语音特征提取算法运行完后进行离线分析,从而判断佩戴者的心理健康,最后再删掉原始语音文本文件,这样不仅可以客观地监测出佩戴者的心理健康变化情况,还可以保护其在长时间监测过程中的个人隐私。
  • 一种可穿戴装置及语音与活动监测系统-201621205360.6
  • 薛雷;杨武庆;花翔;谢飞;冯冲;段建军;陈娇 - 上海贝生医疗设备有限公司
  • 2016-11-08 - 2017-09-08 - G10L25/66
  • 本实用新型提供一种可穿戴装置,包括壳体、设置于壳体内的处理器以及与处理器连接的语音数据采集装置、活动数据采集装置、存储模块与通信接口,语音与活动数据存入存储模块并通过通信接口传送到用于分析语音与活动数据的分析处理设备。所述活动数据采集装置包括加速度传感器。本实用新型还提供一种语音与活动监测系统。本实用新型提供的可穿戴装置及语音与活动监测系统,能够定量地获得语言交互指标和肢体活动指标并将其按照时间关系综合起来,就可以对人的生活状态进行定量测量,使得医生甚至每个人自己从监测的数据中获得相关信息,及时发现生活中存在的造成不健康的问题,使每个人拥有健康的生活。
  • 一种基于语音的帕金森症严重程度诊断方法-201611262218.X
  • 李云;吕艳洁;季薇 - 南京邮电大学
  • 2016-12-30 - 2017-08-15 - G10L25/66
  • 本发明公开了一种基于语音的帕金森症严重程度诊断方法,属于模式识别技术领域。该方法通过以下步骤实现(1)帕金森症患者的语音信号和及其对应UPDRS分值的采集;(2)语音信号进行特征提取;(3)使用岭回归模型构建域适应算法;(4)对得到的所有岭回归模型利用待测患者已知数据进行模型过滤;(5)将过滤后剩余的岭回归模型进行模型融合;(6)利用融合之后的模型对待测患者进行UPDRS分值预测,实现对帕金森症病情严重程度的预测诊断。本发明使用机器学习算法来进行帕金森病情严重程度的预测诊断,降低了帕金森疾病诊断的成本,提高了诊断效率,通过帕金森症患者历史数据学习语音数据与UPDRS之间的关系来诊断,减小了评估误差。
  • 一种评判聋哑患者的听力损伤程度的方法-201710080953.7
  • 薛珮芸;张雪英;白静 - 太原理工大学
  • 2017-02-15 - 2017-06-20 - G10L25/66
  • 本发明涉及残障人群的医疗及教育领域,具体是一种评判聋哑患者的听力损伤程度的方法。一种评判聋哑患者的听力损伤程度的方法,通过三维电磁发音仪获取多位正常人阅读测试语料时的发音器官的发音起始时间和发音器官起始时间,待评判聋哑患者阅读通过三维电磁发音仪获取待评判聋哑患者阅读测试语料时的对应的发音器官的发音起始时间和发音器官起始时间,两者进行对比进而判断评判聋哑患者的听力损伤程度。
  • 一种通过人声分析检测呼吸道的方法-201611230776.8
  • 叶伟 - 上海百芝龙网络科技有限公司
  • 2016-12-28 - 2017-05-31 - G10L25/66
  • 一种通过人声分析检测呼吸道的方法,包括步骤一,通过麦克风收集人声的声音数据,形成可供声纹辨识的声谱图;步骤二,采用声谱图分析仪,根据声音的振幅与仪器的全幅范围,区辨出所需要的人声讯号与背景噪声,分析出说话者的语音震幅、频率、音高、谐波信息,当同一说话者的声谱图采集达到常态分布时,透过声音数据发现说话者的声纹特色;步骤三,收集人生病时的声谱图,提取音频、振幅、音波断裂位置,以及所有身体变化可能会造成声音产生差异的物理特征,透过大数据,比较分析每日的声音频谱图的变化,得知人生病时的声音变化趋势。
  • 一种睡眠分析系统及方法-201610151041.X
  • 杜强;唐元辉;王立 - 北京永数网络科技有限公司
  • 2016-03-16 - 2016-08-10 - G10L25/66
  • 本发明公开了一种睡眠分析系统,包括移动终端、云平台,其中,所述移动终端,用于检测用户睡眠时的声音信息,利用声音识别技术提取所述声音信息中的特征信息,将所述特征信息发送至所述云平台,所述声音信息包括用户睡眠声音、环境噪音;所述云平台,用于接收所述特征信息,根据所述特征信息查询预设语音库获取与所述用户对应的睡眠指导信息。本发明利用现有的移动终端的麦克风检测用户睡眠时的声音信息,利用声音识别技术提取特征信息,并将所述特征信息进行分类后通过云平台海量数据进行分析,对该用户进行针对性的睡眠指导;同时所述云平台还提供了智能叫醒服务。
  • 一种畜禽咳嗽声监测预警装置-201520975670.5
  • 孔繁涛;贾亚雄;陈继兰;孙研研;张建华;韩书庆;刘佳佳 - 中国农业科学院农业信息研究所;北京市畜牧总站;中国农业科学院畜牧兽医研究所
  • 2015-11-30 - 2016-08-10 - G10L25/66
  • 本实用新型提供了一种畜禽咳嗽声监测预警装置,包括:音频采集器、瞬态信号捕捉器、比较单元、触发器以及警报器;所述瞬态信号捕捉器用于捕捉所述音频采集器采集到的音频信号中的瞬态信号,并将所述瞬态信号发送给比较单元;所述比较单元和所述触发器相连,用于对所述瞬态信号的频率与预设频率进行比较,以及对所述瞬态信号的持续时间与预设时间时限进行比较,在所述瞬态信号的频率高于预设频率并且持续时间低于预设时间时限时生成第一比较结果,并将所述第一比较结果发送给所述触发器;所述触发器和所述报警器相连,用于根据所述第一比较结果触发警报器报警。该装置实现了对禽畜进行实时监测,可以及早发现禽畜的呼吸道疾病。
  • 一种基于频域图处理的干罗音识别方法-201510900075.X
  • 屈世豪;应东东;楼瑶 - 杭州百世伽信息科技有限公司
  • 2015-12-08 - 2016-04-13 - G10L25/66
  • 本发明涉及一种基于频域图处理的干罗音识别方法,通过快速傅立叶变换将音频信号从时域转换为频域后将所产生的频域图凭借预设的阈值进行二值化处理过滤得到特定的干罗音信号。该方法可较快实现干罗音识别,效率高,计算量少,系统负荷小,维护简单,填补了目前呼吸音领域暂无自动化识别的空白。本发明的有益效果:通过计算机的高效计算能力,能检测出人耳所无法听见的细微音频并对存在争议判断的罗音类型凭借具体数值给出分类结果。
  • 一种穿戴设备识别语义的方法与系统-201510650043.9
  • 郑战海 - 广东小天才科技有限公司
  • 2015-10-09 - 2016-03-02 - G10L25/66
  • 本发明公开了一种穿戴设备识别语义的方法与系统。该方法通过获取用户发出的语音和发出语音时的生理数据参数;识别所述语音的文字,根据所述生理数据参数识别出用户情绪;通过所述文字和所述用户情绪识别出语义。本发明在识别语音语义过程中,将用户发出的语音与发出语音时用户的情绪相结合,能准确的识别语义,极大的提高了用户的体验。
  • 一种听力评估系统-201510404676.1
  • 蔡跃新 - 中山大学孙逸仙纪念医院
  • 2015-07-10 - 2015-12-02 - G10L25/66
  • 本发明涉及一种听力评估系统,包括数据处理单元、音频产生单元、显示单元和信息接收单元。其中,由数据处理单元启动音频产生单元产生音频信号,并同步控制显示单元显示相应的问题,测试者接听音频信号,根据显示单元上的问题,作出回答,输入到信息接收单元,信息接收单元将测试者所选择的信息发送给数据处理单元,数据处理单元根据测试者的选择,控制音频产生单元调整产生的音频,继续进行测试,并最终得出测试结果。本发明听力评估系统,可以有效评估测试者对音乐的感知与欣赏能力,方便和快捷地测试用户的听力状况,为医生的诊断提供准确和全面的评估信息。
  • 一种病理嗓音细分方法-201210555587.3
  • 陶智;周强;张晓俊;吴迪;肖仲喆;季晶晶 - 苏州大学
  • 2012-12-20 - 2013-08-21 - G10L25/66
  • 本发明公开了一种病理嗓音细分方法,包括模型训练模块和识别模块,模型训练模块对输入的噪音信号进行建模、求取对应的似然度,计算匹配概率并比较,找出满足条件的噪音信号,识别模块将满足条件的噪音信号进行匹配。本发明对输入的嗓音信号的长度没有什么要求,可以是任意类型的特征参数,并且不同的特征分配以不同的权值,这样充分利用各参数的优点,且对特征参数的维数没有限制;可以多次训练,针对那些不易被识别的嗓音信号,进行再训练,且训练中阈值、结束的条件和识别中的条件可以灵活设定。本发明可以自行设定病理嗓音的种类,并进行精确细分,实现嗓音疾病的预诊断及患者恢复状况的及时追踪,同时适应于教师、歌手等进行健康自查。
  • 一种病人虚弱语音端点检测方法-201210594590.6
  • 尹岩岩;殷业;肖龙;关吉萍 - 上海师范大学
  • 2012-12-31 - 2013-05-01 - G10L25/66
  • 本发明公开一种病人虚弱语音端点检测方法,包括以下步骤:将语音信号转换为图像,对此图像进行拉伸和放大,将拉伸和放大后的图像转换成二值图像;对语音信号的波形包络所在区域进行开操作,即其中Θ为腐蚀,为膨胀,再取边界β(A);β(A)=A-A(AΘB)进一步取波形轮廓,其中取边界β(A)为一个像素点;使用平滑滤波器h(x)对信号进行滤波,得到其中为卷积;对g(x)求两阶导数以检测边缘点;找到音频最高点,搜索最高点两边的店,将前点和后点比较,若前点小于后点,则认为此最高点两边的两个点分别为词或音节的起始和结束点。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top