[发明专利]耳机及其语音识别方法有效

专利信息
申请号: 201611067886.7 申请日: 2016-11-24
公开(公告)号: CN106601272B 公开(公告)日: 2019-09-17
发明(设计)人: 赵燕鹏;谢萍 申请(专利权)人: 歌尔股份有限公司
主分类号: G10L25/84 分类号: G10L25/84;G10L15/22
代理公司: 北京鸿元知识产权代理有限公司 11327 代理人: 袁文婷;张宁
地址: 261031 山东省潍*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种耳机及其语音识别方法,其中的耳机语音识别方法包括:信号采集模块采集环境中的环境声音信号,并将所采集到的环境声音信号传递至信号处理模块进行判断识别;信号处理模块接收环境声音信号并判断环境声音信号是否为非持续性环境噪声信号,当环境声音信号为非持续性环境噪声信号时,进一步判断环境声音信号是否为目标信号,当环境声音信号为目标信号时,信号处理模块控制当前播放信号关闭,并将目标信号放大经耳机的发声单元发出。利用上述发明能够在用户佩戴耳机听音的同时,获取外界环境中有用的声音信号。
搜索关键词: 耳机 及其 语音 识别 方法
【主权项】:
1.一种耳机语音识别方法,其特征在于,在所述耳机内设置有拾取声音信号的信号采集模块,所述语音识别方法包括:所述信号采集模块采集环境中的环境声音信号,并将所采集到的环境声音信号传递至信号处理模块进行判断识别;所述信号处理模块接收所述环境声音信号并判断所述环境声音信号是否为非持续性环境噪声信号,当所述环境声音信号为非持续性环境噪声信号时,进一步判断所述环境声音信号是否为目标信号,当所述环境声音信号为目标信号时,所述信号处理模块控制当前播放信号关闭,并将所述目标信号放大经耳机的发声单元发出;其中,在判断所述环境声音信号是否为目标信号的过程中,判断所述环境声音信号是否为重复信号,当所述环境声音信号为重复信号时,确认所述环境声音信号为目标信号;否则,确认所述环境声音信号不是目标信号,不进行预警处理并结束对所述环境声音信号的语音识别;所述非持续性环境噪声信号指的是,在持续性环境噪声信号中突然出现的信号特征完全不同于当前持续性环境噪声信号;或者,和当前持续性环境噪声信号有较大区别的声音信号;所述信号特征包括频率、幅度和能量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于歌尔股份有限公司,未经歌尔股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201611067886.7/,转载请声明来源钻瓜专利网。

同类专利
  • 一种麦克风阵列语音检测方法及装置-201410305486.X
  • 范泛;付中华;黎家力 - 中兴通讯股份有限公司
  • 2014-06-27 - 2019-11-05 - G10L25/84
  • 本发明提供一种麦克风阵列语音检测方法及装置,所述方法包括如下步骤:根据阵列语音输入信号的固定波束输出功率谱和平均功率谱计算阵列语音输入信号的最大子带功率比;根据预先设定的判断条件,采用所述最大子带功率比和当前检测阈值判断当前所处的语音状态;当判断当前转入的语音状态为预设的检测阈值调整状态时,对检测阈值进行调整。本发明提供的麦克风阵列语音方法及装置,在复杂噪声条件下能够准确确定检测阈值,提高噪声检测的准确度。
  • 用于语音检测的方法及设备-201910320025.2
  • P·德赫加尼;R·L·布伦南 - 半导体组件工业公司
  • 2019-04-19 - 2019-10-29 - G10L25/84
  • 本申请案涉及用于语音检测的方法及设备。在一般方面中,一种用于检测语音的设备可包含信号调节级,其接收与声能对应的信号,对接收到的信号进行滤波以产生语音带信号,计算接收到的信号的第一能量值序列,且计算语音带信号的第二能量值序列。设备还可包含检测级,其包含多个语音与噪声区分器。检测级可经配置以接收第一能量值序列及第二能量值序列;且基于第一能量值序列及第二能量值序列,为多个语音与噪声区分器中的每一语音与噪声区分器提供相应的语音检测指示信号。设备还可包含组合级,其经配置以组合相应的语音检测指示信号;且基于相应的语音检测指示信号的组合,提供接收到的信号中存在语音及接收到的信号中不存在语音中的一者的指示。
  • 耳机及其语音识别方法-201611067886.7
  • 赵燕鹏;谢萍 - 歌尔股份有限公司
  • 2016-11-24 - 2019-09-17 - G10L25/84
  • 本发明提供一种耳机及其语音识别方法,其中的耳机语音识别方法包括:信号采集模块采集环境中的环境声音信号,并将所采集到的环境声音信号传递至信号处理模块进行判断识别;信号处理模块接收环境声音信号并判断环境声音信号是否为非持续性环境噪声信号,当环境声音信号为非持续性环境噪声信号时,进一步判断环境声音信号是否为目标信号,当环境声音信号为目标信号时,信号处理模块控制当前播放信号关闭,并将目标信号放大经耳机的发声单元发出。利用上述发明能够在用户佩戴耳机听音的同时,获取外界环境中有用的声音信号。
  • 基于残差时延网络的说话人确认方法、装置、设备及介质-201910384582.0
  • 彭俊清;王健宗 - 平安科技(深圳)有限公司
  • 2019-05-09 - 2019-09-13 - G10L25/84
  • 本发明公开了一种基于残差时延网络的说话人确认方法、装置、设备及介质,所述方法包括:构建残差时延网络,对所述残差时延网络进行训练;获取测试用户的注册音频和测试音频;对所述注册音频和测试音频执行预处理,然后执行特征提取,分别得到注册音频和测试音频的梅尔频率倒谱系数;将所述注册音频/测试音频的梅尔频率倒谱系数传入训练好的所述残差时延网络,获取所述残差时延网络在会话切片级输出的特征向量,作为注册特征向量/待测试特征向量;将所述注册特征向量和待测试特征向量输入概率线性判别分析模型,并根据模型输出的分值输出说话人确认结果。本发明解决了现有文本无关说话人确认方法在短音频方面的准确率欠佳的问题。
  • 杂音检测方法和装置-201410326739.1
  • 许丽净 - 华为技术有限公司
  • 2014-07-10 - 2019-08-20 - G10L25/84
  • 本发明实施例提供一种杂音检测方法和装置,一种杂音检测方法包括:获取音频信号当前帧的频域能量分布参数,获取当前帧的预设邻域范围内的帧中每一帧的频域能量分布参数;获取当前帧的音调参数,获取当前帧的预设邻域范围内的帧中每一帧的音调参数;根据当前帧的音调参数以及当前帧的预设邻域范围内的帧中每一帧的音调参数确定当前帧处于语音段或非语音段;若当前帧处于语音段,且在全部的所述频域能量分布参数中,位于预设的语音类杂音频域能量分布参数区间的频域能量分布参数的数量大于等于第一阈值,则确定当前帧为语音类杂音。本发明实施例提供的杂音检测方法和装置,能够提高音频信号杂音检测的准确性。
  • 降噪装置及方法-201610370200.5
  • 王荣洋 - 努比亚技术有限公司
  • 2016-05-27 - 2019-06-25 - G10L25/84
  • 本发明公开了一种降噪装置,包括:转换模块,用于对音视频文件进行语音识别,将音视频文件转换成文本文件;计算模块,用于分别计算该文本文件中的相邻两个语句之间的相似度;判断模块,用于根据该相邻两个语句之间的相似度判断该相邻两个语句是否存在噪声语句;确定模块,用于在该相邻两个语句存在噪声语句时,根据预设策略确定该相邻两个语句中的一语句为噪声语句;降噪模块,用于将噪声语句从该音视频文件中滤除。本发明还公开了一种降噪方法。采用本发明,可更加客观的识别出音视频文件中的噪声语句,而不受周围环境的影响,可大大提高去除噪声的准确率。
  • 语音检测方法及装置-201510401974.5
  • 孙廷玮 - 展讯通信(上海)有限公司
  • 2015-07-09 - 2019-06-07 - G10L25/84
  • 语音检测方法及装置,所述语音检测方法包括:对输入的声音信号对应的声音数据进行分帧处理得到多个声音帧;计算当前帧的特征向量,所述特征向量包括宽窗位能量差、窄窗位能量差和过零能量差;将当前帧的特征向量与预设的模糊声像规则进行匹配,得到对应的语音检测分值,所述模糊声像规则为对声音训练样本训练得到;当计算得出的语音检测分值大于分值阈值时,对当前帧对应的声音数据进行检测。上述的方案,可以提高语音检测的速度,并降低语音检测的成本。
  • 基于短时能零比的广播语音与噪声检测的方法-201910171499.5
  • 袁三男;刘虹 - 上海电力学院
  • 2019-03-07 - 2019-05-21 - G10L25/84
  • 本发明涉及一种基于短时能零比的广播语音与噪声检测的方法,对输入的语音信号进行分帧;计算每帧语音信号的短时能量;计算每帧语音信号的短时平均过零率;计算每帧信号的短时能量与短时平均过零率的比值,即能零比;对一秒内所有帧能零比进行方差计算,得到的方差与设置阈值进行比较,当方差大于设定阈值时,判断为语音,方差小于设定阈值时,判定为噪声。将语音中噪声识别区分出,便于提升广播或其他声音处理中的声音的清晰度。
  • 基于相关函数最大值的广播语音与噪声检测的方法-201910171860.4
  • 袁三男;刘虹 - 上海电力学院
  • 2019-03-07 - 2019-05-21 - G10L25/84
  • 本发明涉及一种基于相关函数最大值的广播语音与噪声检测的方法,通过对语音信号进行分帧;根据自(互)相关函数公式进行每帧语音信号相关函数计算;求取分帧每帧语音信号的自(互)相关函数或互相关函数的最大值;计算一秒内自(互)相关函数的最大值方差,设置一个阈值常数Th,当最大值方差大于Th时,便判断为语音,最大值方差小于Th时,便判定为噪声。此方法将语音中噪声识别区分出,便于提升广播或其他声音处理中的声音的清晰度。
  • 用于智能交通系统的声源识别方法及装置-201811358787.3
  • 祁兵兵;张焕胜;刘金磊;田晟浩;侍艳华;窦硕鹏 - 北京中电慧声科技有限公司
  • 2018-11-15 - 2019-02-26 - G10L25/84
  • 本发明涉及一种用于智能交通系统的声源识别方法及装置,该方法包括:获取声阵列采集的声源信号,并对所述声源信号作分帧处理,以使每一帧信号短时平稳;分析每一帧信号的倒谱,并提取其频域特征,得到每一帧信号的频率区间;判断连续鸣笛时长内所有帧是否满足触发条件,若是,则以连续鸣笛时长内第一帧为触发信号起始帧,将连续鸣笛时长内的所有信号识别为鸣笛信号;其中,所述触发条件为出现满足频率区间的信号。本发明能够满足智能交通声源定位实际应用中实时性与准确性的需求,不需要事先统计背景噪声的先验知识,也不用鸣笛数据库训练数据模型,简便易操作,且准确度高,算法实现复杂度低,并可从一段信号中提取鸣笛信号进行后续定位计算。
  • 语音检测方法及装置-201811048024.9
  • 李波;夏波 - 成都必盛科技有限公司
  • 2018-09-07 - 2019-01-18 - G10L25/84
  • 本发明提供一种语音检测方法及装置,涉及语音处理技术领域。该语音检测方法及装置包括:获取采集到的声音信号;将声音信号进行分帧加窗处理,获取分段后的多段声音信号;测量获取该多段声音信号中待处理分段声音信号的特真信号,其中,特真信号指示待处理分段声音信号的相关性;采用语音分类模块对特真信号进行分类,确定特真信号的分类,特真信号的分类用于指示待处理分段声音信号中是否包含预设使用者的语音信号;若该特真信号中包含预设使用者的语音信号,则输出待处理分段声音信号含有使用者语音信号的触发信号。使用该语音检测方法及装置,可以从采集到的环境语音中检测是否包含使用者的语音信号。
  • 声音识别方法和系统-201811290201.4
  • 沈松 - 东方智测(北京)科技有限公司
  • 2018-10-31 - 2019-01-18 - G10L25/84
  • 本申请提供一种声音识别方法和系统,该方法包括:实时获取声音,所述声音包括交通噪声;将所述声音转换为离散数字信号以及特征量;根据所述离散数字信号以及所述特征量实时优化深度学习神经网络模型;利用深度学习神经网络模型对所述声音进行识别。本申请的声音识别方法和系统,能够准确识别道路中出现的声音类型,并在识别过程中自动提高识别准确率。
  • 一种语音处理方法、装置、系统及计算机可读存储介质-201811124680.2
  • 郑棉洲 - 广州势必可赢网络科技有限公司
  • 2018-09-26 - 2018-12-21 - G10L25/84
  • 本发明公开了一种语音处理方法、装置、设备及计算机可读存储介质,包括对待处理语音信号进行预处理,得到多个分帧音频信号;对每个分帧音频信号进行特征提取,得到与每个分帧音频信号一一对应的MFCC声学特征参数;采用预先建立的DNN分类模型对各个MFCC声学特征参数进行训练,得到与每个MFCC声学特征参数一一对应的类别信息,类别信息包括人声和非人声。本申请能够自动对待处理语音信号进行非人声分类,不仅减轻了工作人员的工作负担,还大大提高了工作效率和分类准确率。
  • 语音区分方法、装置、计算机设备及存储介质-201810561789.6
  • 涂宏 - 平安科技(深圳)有限公司
  • 2018-06-04 - 2018-11-13 - G10L25/84
  • 本发明公开了一种语音区分方法、装置、计算机设备及存储介质。该语音区分方法包括:基于语音活动检测算法处理原始待区分语音数据,获取目标待区分语音数据;基于所述目标待区分语音数据,获取相对应的ASR语音特征;将所述ASR语音特征输入到预先训练好的ASR‑DBN模型中进行区分,获取目标区分结果。采用该语音区分方法可以很好地区分目标语音和干扰语音,在语音数据噪音干扰非常大的情况下,仍然可以进行准确的语音区分。
  • 噪音抑制方法、装置及系统-201510534459.4
  • 侯震 - 广州市百果园网络科技有限公司
  • 2015-08-27 - 2018-09-04 - G10L25/84
  • 本发明公开了一种噪音抑制方法、装置及系统,属于网络通话领域。该方法包括:发送端采集包括若干语音帧的语音帧序列,将语音帧序列中的第i个语音帧发送至接收端,i≥1,接收端将第i个语音帧缓存至缓冲区,发送端对该语音帧进行固定时长的延时处理,对第i个语音帧进行噪音检测,得到噪音检测结果,将噪音检测结果发送至接收端,接收端根据噪音检测结果对位于缓冲区中的第i个语音帧进行噪音抑制处理;解决了现有技术中的噪声抑制方法中存在的延时处理产生的时延被直接带入传输过程,影响实时通话的通话效果的问题;达到了将噪音检测过程产生的延时与接收端在接收时的缓冲延时重叠,从而减少噪声抑制时延,提升实时通话的通话质量的效果。
  • 基于两步排列熵的语音活动检测方法-201510629748.2
  • 徐宁;李海燕;鲍静益;蒋爱民;刘小峰 - 河海大学常州校区
  • 2015-09-28 - 2018-08-24 - G10L25/84
  • 本发明公开了一种基于两步排列熵的语音活动检测方法,其特征是,具体包括如下步骤:(1)对语音信号进行分帧处理,得到各帧语音信号;(2)计算各帧语音信号的短时能量;(3)各帧语音信号进行第一步排列熵计算;(4)通过短时能量和排列熵,作第一步判断,检测噪声和语音信号;(5)对检测出的语音信号进行第二步排列熵计算;(6)判断语音信号的清浊音。本发明所达到的有益效果:充分利用了语音信号帧数之间的准周期性,利用排列熵作为语音信号复杂度的度量标准,实现语音活动检测的目的。
  • 一种声音处理方法及终端设备-201810129930.5
  • 陶然;李真真 - 上海爱优威软件开发有限公司
  • 2018-02-08 - 2018-08-14 - G10L25/84
  • 本申请涉及智能终端技术领域,特别涉及一种声音处理方法及终端设备,其中,方法应用于终端设备,方法包括:生成检测指令;基于检测指令,对终端设备周围预定范围内的环境噪声进行检测识别;判断环境噪声中是否包含符合预定要求的目标声音;若环境噪声中包含符合预定要求的目标声音,则对目标声音进行预定处理;向耳机设备输出被进行过预定处理后的目标声音,本申请的方案利用用户在戴耳机设备时难以听见或听清外界环境的声音,而终端设备可“听见”外界环境的声音,进而借助终端设备帮助用户及时感知外界环境变化,让终端设备成为用户的“第三只耳朵”,提高终端设备的智能化和人性化水平,提高用户的使用体验。
  • 一种自动录制人声的方法及模块-201810001321.1
  • 夏令洲;王元强;林帅 - 山东浪潮商用系统有限公司
  • 2018-01-02 - 2018-08-03 - G10L25/84
  • 本发明公开了一种自动录制人声的方法及模块,属于声音识别与录制领域,要解决的技术问题为如何准确的自动识别并录制人声。其方法为通过声音强度和声音频率自动识别人声,并自动录制人声,包括:识别人声:将监听到的当前声音与预设的声音强度和声音频率作对比,如果当前声音符合预设的声音强度和声音频率,则判断当前声音为人声;录制人声:监听到人声后,自动开启声音录制,进行人声录制;保存人声:将监听到的预定时间段内的当前声音与预设的声音强度和声音频率作对比,如果当前声音不符合预设的声音强度或声音频率,则判断当前人声结束,自动结束声音录制并保存录制的人声。且结构包括声音监听单元和声音录制单元。
  • 低功率语音命令检测器-201680014560.X
  • H·伯耶松;M·亚伯拉罕森 - 索尼公司
  • 2016-01-07 - 2017-12-01 - G10L25/84
  • 低功率语音命令检测方法使用音频监测装置以捕获声音。所捕获的声音在多个步骤中被分析以确定它是否满足关于声级、语音内容和可识别语音命令的多个标准。对于每个步骤,处理更加复杂且功率要求很高。第一步和后续步骤之间的阈值用于选通进一步的处理。基于分析结果动态地调节此阈值,以避免不必要的处理并提高系统性能。
  • 一种在听音乐状态下提示环境危机声音的耳机-201610217584.7
  • 王美金 - 王美金
  • 2016-04-08 - 2016-07-06 - G10L25/84
  • 一种在听音乐状态下提示环境危机声音的耳机的方法和系统,包括耳机、环境危险声音收集分发装置;耳机包括蓝牙模块、环境噪声采集模块、环境危险声音识别模块、声音控制模块;环境危险声音收集分发装置;环境噪声采集模块对外界环境的噪声进行检测和采集,并将噪声经傅里叶变换得到频域噪声信号,将频域噪声信号按频率顺序展开,依次计算其特征,送环境环境危险声音识别模块。环境危险声音识别模块包括环境危险声音识别单元、声音特征储存模块;环境危险声音识别单元接收环境噪声采集模块传来的噪声特征,如果与声音特征储存模块中的环境危险声音特征相符,则将发信号给声音控制模块。
  • 一种录音方法及装置-201410341500.1
  • 孙丽 - 深圳市中兴移动通信有限公司
  • 2014-07-17 - 2014-10-29 - G10L25/84
  • 本发明公开了一种录音方法及装置,属于音频处理技术领域。方法流程包括:检测语音声源;对检测到的语音声源进行分离;获取并存储分离出来的各独立声源的语音数据;对存储的每个独立声源的语音数据进行分析,并根据分析结果调整所述各独立声源的声音效果;将调整后的各独立声源进行混音处理;将所述混音处理得到的音频信号按照预定的文件格式进行存储。采用本发明,能够将语音声源分离成独立声源,通过调整各独立声源的声音效果,从而获取理想的混音效果,达到在保证远距离录音效果的同时避免近距离录音的破音现象,有效的提高了各种环境下的录音效果。
  • 远程电话会议系统及方法-201210144228.9
  • 徐筱琦;杨朝光 - 宏碁股份有限公司
  • 2012-05-10 - 2013-11-13 - G10L25/84
  • 本发明提供一种远程电话会议系统及方法,该系统包括:一远端麦克风数组,用以接收远端声音;一声音辨识模块,用以从远端声音中辨识出多个音源;一近端显示界面,用以显示所述多个音源;一声音调整模块,用以分别针对各该音源的一声音特征进行调整。本发明可将远端与会人员的空间位置予以视觉化,相对于现有技术而言,更有助于近端与会人员了解远端与会人员的座位关系,并借此提供调整声音参数的基础,达到提升远程电话会议质量的目的。
  • 一种基于时间序列核聚类的机场噪声事件识别方法-201310186796.X
  • 王建东;邹朋成;王平水 - 南京航空航天大学
  • 2013-05-17 - 2013-10-02 - G10L25/84
  • 本发明公开了一种基于时间序列核聚类的机场噪声事件识别方法,属于机场噪声识别领域。该方法首先获取机场噪声的原始监测时间序列,接着对原始监测时间序列进行预处理,创建噪声时间序列数据集,再利用基于全局对准核的k均值聚类方法,对噪声时间序列数据集进行自动分类,并通过多次循环得到多个聚类结果,然后对多个聚类结果中的每一类噪声时间序列添加相应的噪声事件类别标签,创建噪声事件知识库,最后根据该知识库对待识别的噪声时间序列进行噪声事件识别。本方法智能程度高,有效提高了机场噪声事件识别的效率和准确度。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top