专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果15个,建议您升级VIP下载更多相关专利
  • [发明专利]基于局部注意力机制的语音增强方法、装置及介质-CN202010117498.5有效
  • 方泽煌;康元勋 - 厦门亿联网络技术股份有限公司
  • 2020-02-25 - 2023-04-18 - G10L21/02
  • 本发明公开了一种基于局部注意力机制的语音增强方法,包括:采集待处理语音,对待处理语音进行语音合成处理,得到待增强语音;对待增强语音进行特征提取,得到待增强语音的多维特征;建立基于局部注意力机制的RNN模型,并将多维特征输入至RNN模型;对RNN模型进行训练,得到语音增强模型;根据语音增强模型对多维特征进行计算得到时频掩蔽因子,根据时频掩蔽因子以及待增强语音的频谱,得到待增强语音的增强语音频谱;根据增强语音频谱得到语音增强波形。本发明提供的一种基于局部注意力机制的语音增强方法及系统,能够有效提高语音增强的效果,且能够有效提高语音增强的稳定性和可靠性。
  • 基于局部注意力机制语音增强方法装置介质
  • [发明专利]一种构建语音端点检测模型的方法及语音端点检测系统-CN201910394746.8有效
  • 方泽煌;康元勋;冯万健 - 厦门亿联网络技术股份有限公司
  • 2019-05-13 - 2021-08-03 - G10L25/87
  • 本发明公开了一种构建语音端点检测模型的方法及语音端点检测系统,属于语音识别技术领域。本发明的一种构建语音端点检测模型的方法,先采集音频数据并合成混合语音,而后对混合语音进行特征提取得到62维特征,再将62维特征输入至RNN模型进行训练得到语音端点检测模型。本发明的一种语音端点检测系统,包括采集单元、计算单元、传输单元和终端,采集单元与计算单元电连接,计算单元和终端分别与传输单元连接。本发明克服了现有技术中,语音识别准确性和稳定性不高的不足,提供了一种构建语音端点检测模型的方法及语音端点检测系统,对各类噪声下的语音数据具有较高的识别率,可以应用部署至实时会议通信设备。
  • 一种构建语音端点检测模型方法系统
  • [发明专利]一种窄带语音信号检测方法、装置、系统和可读存储介质-CN202011376870.0在审
  • 方泽煌;康元勋 - 厦门亿联网络技术股份有限公司
  • 2020-11-30 - 2021-03-19 - G10L25/21
  • 本发明公开了一种窄带语音信号检测方法,包括:对待检测的语音信号进行傅里叶变换,以计算语音信号的全频段幅度谱能量;根据全频段幅度谱能量,计算高频平均能量和低频平均能量;其中,高频为5kHz~6kHz,低频为2.5kHz~3.5kHz;根据高频平均能量和低频平均能量,计算能量衰减比;当能量衰减比大于第一预设值时,判定待检测的语音信号为窄带语音信号。本发明利用语音信号本身的特征进行统计,并设计相关门限来判断的方法,能有效识别宽带信号和窄带信号,并且计算和内存占用资源小,可实时应用于会议系统和终端设备中,以解决在多方会议通信时,窄带语音信号和宽带语音信号的交替出现使得频带扩展算法无法很好的作用在窄带语音信号的问题,有效提升频带扩展的效果。
  • 一种窄带语音信号检测方法装置系统可读存储介质
  • [发明专利]基于深度学习注意力机制的频带扩展方法及装置-CN202010933415.X在审
  • 方泽煌;康元勋 - 厦门亿联网络技术股份有限公司
  • 2020-09-08 - 2021-01-15 - G10L19/022
  • 本发明实施例公开一种基于深度学习注意力机制的频带扩展方法及装置,所述方法包括:基于窄带语音信号生成伪高频信号;计算所述伪高频信号的功率谱能量;通过预先训练好的逆滤波参数估计模型,获取所述伪高频信号功率谱能量对应的逆滤波参数;所述逆滤波参数估计模型为基于深度学习注意力机制,以伪高频信号的功率谱能量作为输入,逆滤波参数作为输出训练得到;将所述逆滤波参数与所述伪高频信号的频谱相乘,得到相乘结果;对所述相乘结果进行逆傅里叶变换和低通滤波处理,得到宽带信号。本发明实施例既保证了扩频效果,保证语音质量,还可应用部署于要求时延低,内存小、计算能力较弱的通信设备。
  • 基于深度学习注意力机制频带扩展方法装置
  • [发明专利]基于线性滤波的频带扩展方法、装置及会议终端系统-CN202010933315.7在审
  • 方泽煌;康元勋 - 厦门亿联网络技术股份有限公司
  • 2020-09-08 - 2021-01-08 - G10L19/04
  • 本发明实施例公开一种基于线性滤波的频带扩展方法、装置及会议终端系统,所述方法包括:对样本窄带语音信号进行上采样处理,得到采样后的时域语音信号;提取所述时域语音信号的LPC系数和LPC残差;利用所述LPC系数对待扩频的语音信号进行一阶FIR滤波器滤波,得到残差语音信号;根据所述LPC残差和所述LPC系数确定脉冲响应信号;利用所述残差语音信号生成宽带激励信号;对所述脉冲响应信号进行傅里叶变换,得到傅里叶变换结果;将所述宽带激励信号和所述傅里叶变换结果进行相乘,并对相乘结果进行逆傅里叶变换,得到频带扩展后的宽带信号。本发明实施例既能够降低计算开销、占用内存,且相比于传统频带扩展方法,能够提升语音质量、适用于各种编解码场景。
  • 基于线性滤波频带扩展方法装置会议终端系统
  • [发明专利]语音命令词识别方法、装置、会议终端及会议终端系统-CN202010491988.1在审
  • 方泽煌;康元勋 - 厦门亿联网络技术股份有限公司
  • 2020-06-02 - 2020-10-20 - G10L15/22
  • 本发明公开一种语音命令词识别方法、装置、会议终端及会议终端系统,所述方法包括:提取语音信号的MFCC特征并将所述MFCC特征输入到采用隐马尔可夫模型建立的预先训练好的声学模型,获得相应的三音素后验概率,并根据所述三音素后验概率,采用预先训练好的n‑gram语言模型构建解码网络并进行解码运算,搜索最优路径,获得期望输出的命令词识别结果;再通过对所述最优路径的权重进行累加统计,获得所述命令词识别结果的置信度,最后根据所述置信度判断所述命令词识别结果是否可信,若可信,则输出所述命令词识别结果,否则,拒识所述命令词识别结果。本发明能够在只有少量的训练数据下,依然能够获得准确的识别效果。
  • 语音命令识别方法装置会议终端系统
  • [发明专利]一种生成混响衰减参数模型的方法及计算系统-CN202010016844.0在审
  • 方泽煌;康元勋 - 厦门亿联网络技术股份有限公司
  • 2020-01-08 - 2020-06-05 - G10L21/0208
  • 本发明公开了一种生成混响衰减参数模型的方法及计算系统,属于音频信号处理技术领域。本发明方法为:先采集语音数据和RIR数据,再将语音数据和RIR数据合成得到混响语音数据;之后对混响语音数据进行处理得到J帧,每帧提取H维特征;再利用RNN模型对J帧及每帧提取的H维特征进行训练得到混响衰减参数模型。本发明的系统包括采集单元、计算单元和存储单元,采集单元和计算单元电连接;计算单元通过传输单元与存储单元连接;本发明的目的在于克服现有技术中,不能准确计算实时的混响衰减参数的不足,本发明可以实时计算室内的混响衰减参数,对于室内环境变化的适应能力较强,进而可以提高混响消除的效果。
  • 一种生成混响衰减参数模型方法计算系统
  • [发明专利]一种生成混响语音数据的方法和系统-CN202010016814.X在审
  • 康元勋;方泽煌 - 厦门亿联网络技术股份有限公司
  • 2020-01-08 - 2020-05-29 - G10L13/02
  • 本发明公开了一种生成混响语音数据的方法和系统,属于语音数据生成领域。本发明的方法为:先采集语音数据,并采用仿真的方式生成RIR数据;之后对语音数据进行处理,再通过卷积运算将处理后的语音数据和RIR数据合成混响语音数据。本发明的系统包括采集单元、计算单元和存储单元,采集单元与计算单元电连接,计算单元通过传输单元与存储单元连接。本发明的目的在于克服现有技术中,不能生成大量的混响语音数据,导致深度学习所需的混响语音数据匮乏的不足,提供了一种生成混响语音数据的方法和系统,可以生成批量的混响语音数据,从而满足深度学习对混响语音数据的需求。
  • 一种生成混响语音数据方法系统
  • [发明专利]一种语音晚期混响抑制方法及系统-CN202010016846.X在审
  • 方泽煌;康元勋 - 厦门亿联网络技术股份有限公司
  • 2020-01-08 - 2020-05-19 - G10L21/0208
  • 本发明公开了一种语音晚期混响抑制方法及系统,属于语音处理技术领域。本发明的方法为先采集室内的混响语音信号,提取混响衰减参数;再根据混响衰减参数计算混响频谱特征a;之后根据混响频谱特征a及朴素谱减法计算混响抑制后的语音频谱特征b;然后对语音频谱特征b进行插值计算,利用混响语音信号的相位特征对语音频谱特征b进行还原得到波形语音,并输出该波形语音。本发明的系统包括采集单元、计算单元、传输单元和终端,采集单元与计算单元电连接,计算单元和终端分别与传输单元连接;本发明的目的在于克服现有技术中,语音晚期混响抑制方法不能适应时变的混响环境的不足,本发明可以适应时变的混响环境,稳定抑制晚期混响。
  • 一种语音晚期混响抑制方法系统

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top