专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果2708588个,建议您升级VIP下载更多相关专利
  • [发明专利]神经网络的训练和语音端点检测方法及装置-CN201911391398.5有效
  • 胡雪成 - 思必驰科技股份有限公司
  • 2019-12-30 - 2022-07-05 - G10L15/04
  • 本发明公开神经网络的训练和语音端点检测方法及装置,其中,一种神经网络的训练和语音端点检测方法,包括将语音音频和非语音音频随机混合形成混合音频;提取混合音频的声学特征;以及将声学特征输入FSMN模型中,训练FSMN模型使得FSMN模型的输出的对于语音音频和非语音音频的分类基本等于混合音频语音音频和非语音音频的分类本申请实施例的方案混合非语音音频语音音频,之后用于前馈序列记忆神经网络的输入对该神经网络进行训练,使得该神经网络能够输出各音频单元属于语音音频还是非语音音频的分类,之后可以用于语音端点检测,使得语音端点检测的结果更加精准。
  • 神经网络训练语音端点检测方法装置
  • [发明专利]音频的处理方法、装置、设备、介质及计算机程序产品-CN202210007064.9在审
  • 高毅;杨清山;罗程;李斌;张思宇 - 腾讯科技(深圳)有限公司
  • 2022-01-05 - 2022-04-12 - H04L65/60
  • 本申请公开了一种音频的处理方法、装置、设备、介质及计算机程序产品,涉及音频处理领域。该方法包括:获取音频对应的音频特征,音频为待进行语音传输的音频音频特征用于指示音频的能量分布情况;基于音频特征对音频进行噪声抑制处理,得到降噪音频;基于音频特征对应的能量分布情况确定语音检测数据语音检测数据用于指示音频语音信号的存在情况;根据语音检测数据对降噪音频进行音量缩放处理,得到目标音频,目标音频为用于进行语音传输的音频。根据音频特征对应的能量分布确定该音频中是否包含语音信号后,对降噪后的音频进行音量调整,提升了音频在音量调整过程中的增益效果。
  • 音频处理方法装置设备介质计算机程序产品
  • [发明专利]音频的处理方法及装置、模型训练方法及装置-CN201910533494.2在审
  • 吴本谷;宋莎莎 - 北京猎户星空科技有限公司
  • 2019-06-19 - 2020-12-22 - G10L25/84
  • 本申请公开一种音频的处理方法及装置、模型训练方法及装置,属于语音处理技术领域,该方法包括:获取音频,将音频输入到判别模型中,以判别音频是否为有效数据,若根据判别模型的输出结果确定音频为有效数据,则将音频输入到语音识别系统中进行语音识别,这样,先利用判别模型对获取到的音频的有效性进行判别,根据判别结果确定音频有效时再对音频进行语音识别,仅选择有效的音频进行语音识别,而不再是不加选择地对获取到的所有音频均进行语音识别,可有效降低吵杂环境中语音识别系统误识别无效音频的概率、提高用户体验,不对无效音频进行语音识别还可节省语音识别系统的软/硬件资源。
  • 音频数据处理方法装置模型训练
  • [发明专利]语音识别方法、语音识别装置与语音识别系统-CN202211131469.X在审
  • 冯晓闯;陈明;李志杰;田斌;李健;武卫东 - 北京捷通华声科技股份有限公司
  • 2022-09-16 - 2022-12-23 - G10L15/26
  • 本申请提供了一种语音识别方法、语音识别装置与语音识别系统。该语音识别方法包括:接收发送端发送的单通道音频,其中,单通道音频为多个角色音频封装得到的单通道的音频,角色音频为具有角色标记的多通道音频,多通道音频为发送端采集的音频;对单通道音频进行语音识别处理,得到各角色的语音识别文本信息。该语音识别方法中,由于发送端发送给接收端的是单通道音频,这样保证了音频在传输的过程中占用的带宽资源较少。由于接收端无需进行角色识别等等,只需对单通道音频进行语音识别,这样还保证了接收端的计算量较少。
  • 语音识别方法装置系统
  • [发明专利]一种玩具的基于语音识别的自学习方法和自学习装置-CN201610142668.9有效
  • 孙涛 - 深圳市艾塔文化科技有限公司
  • 2016-03-14 - 2018-08-31 - A63H33/00
  • 本发明公开了一种玩具的基于语音识别的自学习方法和自学习装置。该自学习方法,包括:输出语音采集提示,开启语音采集设备;所述语音采集设备采集第一音频,提取所述第一音频的特征数据;所述语音采集设备采集与所述第一音频匹配的第二音频;将所述第一音频和第二音频关联保存通过在输出提示后所述语音采集设备采集第一音频并提取音频的特征数据,在采集与第一音频匹配的第二音频后将第二音频和第一音频关联保存,实现了玩具自身对语音的学习,避免了预存语音对玩具的语种的限制,避免了玩具制作过程中针对不同语种区域预存不同音频
  • 一种玩具基于语音识别自学习方法装置
  • [发明专利]提醒音频的生成方法、装置、电子设备和存储介质-CN202110653252.4在审
  • 刘晶;刘建立 - 阿波罗智联(北京)科技有限公司
  • 2021-06-11 - 2021-09-28 - G06F3/16
  • 本公开提供了提醒音频的生成方法、装置、电子设备和存储介质,涉及人工智能技术领域,具体为深度学习、云平台技术领域。具体实现方案为:获取音频,检测到音频语音数据,则缓存音频,以及检测到音频为非语音数据,则停止缓存音频,并在已缓存的音频的内容为提醒内容时,将已缓存的音频确定为提醒音频,并将提醒音频存储至磁盘中通过对音频的检测,获取其中为语音数据音频,并缓存,并在已缓存的音频为包含提醒内容的音频时,将其确定为提醒音频,存储至磁盘,从而将获取的音频中的非语音数据语音数据中的非提醒音频去除,实现提醒音频的准确录制。
  • 提醒音频生成方法装置电子设备存储介质
  • [发明专利]一种语音的存储方法和装置-CN201010165733.2无效
  • 孙健;李加周;阮亚平;林亚 - 中兴通讯股份有限公司
  • 2010-04-14 - 2011-10-19 - G06F17/30
  • 本发明公开一种语音的存储方法和装置,所述方法包括:在多用途语音存储文件中记录所述多用途语音存储文件的基本信息;将多用途语音编解码器(VAC)帧数据顺序存储到所述多用途语音存储文件中;在所述多用途语音存储文件中记录所述多用途语音存储文件的负载信息;在所述多用途语音存储文件中记录其存储的VAC帧的索引信息。本发明能够实现多用途语音方便的回放功能,并且可以高效获取文件信息,实现定位播放和分级播放。
  • 一种语音频数存储方法装置
  • [发明专利]语音数据的处理方法、装置及电子设备-CN202110330333.0有效
  • 冀利刚;何建邦;朱磊;邓志伟 - 智道网联科技(北京)有限公司
  • 2021-03-29 - 2021-07-09 - G11B20/10
  • 本申请是关于一种语音数据的处理方法、装置及电子设备。该方法包括:分别采集环境音频和本地播放音频;其中,环境音频包括待识别语音数据和待消除音频的混合音频,待消除音频与本地播放音频具有相同的音频;将本地播放音频进行缓存;当本地播放音频的缓存容量达到预设存储容量时,同步处理环境音频和本地播放音频,以消除环境音频中的待消除音频,并识别环境音频中的待识别语音数据。本申请提供的方案,可以提高识别环境音频中的待识别语音数据的准确率,本申请的处理方法简单易行,处理效率高。
  • 语音数据处理方法装置电子设备
  • [发明专利]一种声源定位方法、装置、设备及存储介质-CN202310066371.9在审
  • 刘威亚;刘贝易 - 思必驰科技股份有限公司
  • 2023-01-17 - 2023-04-28 - G01S5/18
  • 本发明提供一种声源定位方法、装置、设备及存储介质,所述方法包括:对接收到的原始音频进行语音分离,获得多路分离音频;计算所述多路分离音频中每一路分离音频语音存在概率;根据所述每一路分离音频语音存在概率,确定出目标分离音频;将所述目标音频分离数据对应的语音存在概率与所述原始音频相乘,获得待定位音频;对所述待定位音频进行声源定位,确定出所述原始音频中的人声方位。本发明实现了声源定位过程中直接、准确、快速定位出人声所在方位,为后续语音交互奠定了准确的数据基础,进而提升了语音交互的效果。
  • 一种声源定位方法装置设备存储介质
  • [发明专利]自动增益控制装置及方法-CN201410438031.5有效
  • 王海业 - 无锡中感微电子股份有限公司
  • 2014-08-29 - 2017-07-18 - G10L21/02
  • 本发明提供一种自动增益控制装置及方法,所述方法包括采集模拟的音频信号;将采集的模拟的音频信号进行模数转换形成数字的音频;将所述数字的音频进行编码得到连续的多帧音频;对每帧音频进行活动语音检测以将各个音频帧区分为语音数据帧和非语音数据帧;对各语音数据帧进行能量检测以将各语音数据帧区分为背景语音数据帧和目标语音数据帧;根据各帧音频的类型确定其对应的增益,非语音数据帧和背景语音数据帧的增益小于等于0dB,目标语音数据帧的增益大于0dB;根据自动增益控制模块确定的各个音频帧的增益对各个音频帧进行信号幅度的调整。这样可以增强目标语音,抑制背景语音,提高了用户的体验。
  • 自动增益控制装置方法
  • [发明专利]一种语音识别方法及装置-CN202011624401.6在审
  • 陈孝良;冯大航;许孝先;常乐 - 北京声智科技有限公司
  • 2020-12-31 - 2021-04-02 - G10L21/043
  • 本发明适用于语音识别技术领域,提供了一种语音识别方法及装置,该方法包括:对获取的第一音频进行语速识别,获取所述第一音频的初始语速;基于基准语速和所述初始语速,对所述第一音频进行语音变速处理,获得调整后的第二音频,所述第二音频的语速与所述基准语速一致;对所述第二音频进行语音识别,获取语音识别结果。本发明通过对音频的语速进行调整后再进行语音识别,由于音频的语速与基准语速一致,因此可以极大减少语音识别模型的训练数据,从而节省音频资源和训练时间成本。
  • 一种语音识别方法装置

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top