“方泽煌”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果15个，建议您升级VIP下载更多相关专利

[发明专利]基于自注意力机制的语音活动检测方法、装置及存储介质-CN202010117497.0有效
发明人： 方泽煌;康元勋 -专利权人：厦门亿联网络技术股份有限公司
申请日： 2020-02-25 - 公布日： 2023-05-23 - 主分类号： G10L25/87 文献下载
摘要：本发明公开了一种基于自注意力机制的语音活动检测方法，包括：采集待处理语音，对待处理语音进行语音合成处理，得到待检测语音；对待检测语音进行特征提取，得到待检测语音的多维特征；建立基于自注意力机制的RNN模型，并将多维特征输入至RNN模型；对RNN模型进行训练，得到语音检测模型；语音检测模型根据多维特征计算待检测语音的状态值，并根据状态值判断待检测语音的类别。本发明提供的一种基于自注意力机制的语音活动检测方法及装置，能够有效提高语音活动检测的效果，且能够有效提高语音活动检测的稳定性和可靠性。
基于注意力机制语音活动检测方法装置存储介质

[发明专利]基于局部注意力机制的语音增强方法、装置及介质-CN202010117498.5有效
发明人： 方泽煌;康元勋 -专利权人：厦门亿联网络技术股份有限公司
申请日： 2020-02-25 - 公布日： 2023-04-18 - 主分类号： G10L21/02 文献下载
摘要：本发明公开了一种基于局部注意力机制的语音增强方法，包括：采集待处理语音，对待处理语音进行语音合成处理，得到待增强语音；对待增强语音进行特征提取，得到待增强语音的多维特征；建立基于局部注意力机制的RNN模型，并将多维特征输入至RNN模型；对RNN模型进行训练，得到语音增强模型；根据语音增强模型对多维特征进行计算得到时频掩蔽因子，根据时频掩蔽因子以及待增强语音的频谱，得到待增强语音的增强语音频谱；根据增强语音频谱得到语音增强波形。本发明提供的一种基于局部注意力机制的语音增强方法及系统，能够有效提高语音增强的效果，且能够有效提高语音增强的稳定性和可靠性。
基于局部注意力机制语音增强方法装置介质

[发明专利]一种用于语音特征的提取方法和系统-CN201910818573.8有效
发明人： 方泽煌;康元勋;冯万健 -专利权人：厦门亿联网络技术股份有限公司
申请日： 2019-08-30 - 公布日： 2022-03-04 - 主分类号： G10L25/03 文献下载
摘要：本发明给出了一种用于语音特征的提取方法和系统，包括响应于检测到语音信号的时域信号，提取语音信号的语音特征，其中，语音特征包括MFCC系数和LPC系数；基于神经网络的全连接层，对MFCC系数和LPC系数进行线性变换和非线性激活，获取MFCC系数和LPC系数的全连接层输出；基于MFCC系数和LPC系数的全连接层输出，利用均值计算获取语音信号的融合特征。本发明主要应用于神经网络模型，能够十分有效的提高基于神经网络的语音活动检测模型的准确率，以满足实际场景的应用。
一种用于语音特征提取方法系统

[发明专利]一种构建语音端点检测模型的方法及语音端点检测系统-CN201910394746.8有效
发明人： 方泽煌;康元勋;冯万健 -专利权人：厦门亿联网络技术股份有限公司
申请日： 2019-05-13 - 公布日： 2021-08-03 - 主分类号： G10L25/87 文献下载
摘要：本发明公开了一种构建语音端点检测模型的方法及语音端点检测系统，属于语音识别技术领域。本发明的一种构建语音端点检测模型的方法，先采集音频数据并合成混合语音，而后对混合语音进行特征提取得到62维特征，再将62维特征输入至RNN模型进行训练得到语音端点检测模型。本发明的一种语音端点检测系统，包括采集单元、计算单元、传输单元和终端，采集单元与计算单元电连接，计算单元和终端分别与传输单元连接。本发明克服了现有技术中，语音识别准确性和稳定性不高的不足，提供了一种构建语音端点检测模型的方法及语音端点检测系统，对各类噪声下的语音数据具有较高的识别率，可以应用部署至实时会议通信设备。
一种构建语音端点检测模型方法系统

[发明专利]语音增强质量评估方法、装置、终端及存储介质-CN202011376869.8在审
发明人： 方泽煌;康元勋 -专利权人：厦门亿联网络技术股份有限公司
申请日： 2020-11-30 - 公布日： 2021-03-19 - 主分类号： G10L25/60 文献下载
摘要：本发明公开了一种语音增强质量评估方法、装置、终端及存储介质，利用干净语音信号作为原始信号，在进行语音增强之前叠加不同类型的噪声生成带噪语音信号，接着通过语音增强算法处理生成语音增强信号，最后将干净的原始语音信号和语音增强信号导入PESQ中得到语音增强质量评估分数，该方法可以任意地模拟不同场景的带噪语音信号，实现在大规模的场景测试中更加灵活方便地进行语音增强质量评估。
语音增强质量评估方法装置终端存储介质

[发明专利]一种窄带语音信号检测方法、装置、系统和可读存储介质-CN202011376870.0在审
发明人： 方泽煌;康元勋 -专利权人：厦门亿联网络技术股份有限公司
申请日： 2020-11-30 - 公布日： 2021-03-19 - 主分类号： G10L25/21 文献下载
摘要：本发明公开了一种窄带语音信号检测方法，包括：对待检测的语音信号进行傅里叶变换，以计算语音信号的全频段幅度谱能量；根据全频段幅度谱能量，计算高频平均能量和低频平均能量；其中，高频为5kHz～6kHz，低频为2.5kHz～3.5kHz；根据高频平均能量和低频平均能量，计算能量衰减比；当能量衰减比大于第一预设值时，判定待检测的语音信号为窄带语音信号。本发明利用语音信号本身的特征进行统计，并设计相关门限来判断的方法，能有效识别宽带信号和窄带信号，并且计算和内存占用资源小，可实时应用于会议系统和终端设备中，以解决在多方会议通信时，窄带语音信号和宽带语音信号的交替出现使得频带扩展算法无法很好的作用在窄带语音信号的问题，有效提升频带扩展的效果。
一种窄带语音信号检测方法装置系统可读存储介质

[发明专利]一种用于频带扩展算法的数据生成方法、系统及存储介质-CN202010933314.2在审
发明人： 方泽煌;康元勋 -专利权人：厦门亿联网络技术股份有限公司
申请日： 2020-09-08 - 公布日： 2021-01-15 - 主分类号： G10L15/06 文献下载
摘要：本发明公开了一种用于频带扩展算法的数据生成方法，步骤包括：采集语音数据，所述语音数据包括宽带语音数据、混响数据及噪声数据；在所述宽带语音数据的基础上，按照设定概率添加所述混响数据和所述噪声数据，以生成宽带语音训练数据；对所述宽带语音训练数据进行下采样处理以生成对应的窄带语音训练数据，并输出所述宽带语音训练数据和所述窄带语音训练数据。本发明提供了一种用于频带扩展算法的数据生成方法、系统及存储介质，能够依据少量现有数据集快速生成海量的训练数据。
一种用于频带扩展算法数据生成方法系统存储介质

[发明专利]基于深度学习注意力机制的频带扩展方法及装置-CN202010933415.X在审
发明人： 方泽煌;康元勋 -专利权人：厦门亿联网络技术股份有限公司
申请日： 2020-09-08 - 公布日： 2021-01-15 - 主分类号： G10L19/022 文献下载
摘要：本发明实施例公开一种基于深度学习注意力机制的频带扩展方法及装置，所述方法包括：基于窄带语音信号生成伪高频信号；计算所述伪高频信号的功率谱能量；通过预先训练好的逆滤波参数估计模型，获取所述伪高频信号功率谱能量对应的逆滤波参数；所述逆滤波参数估计模型为基于深度学习注意力机制，以伪高频信号的功率谱能量作为输入，逆滤波参数作为输出训练得到；将所述逆滤波参数与所述伪高频信号的频谱相乘，得到相乘结果；对所述相乘结果进行逆傅里叶变换和低通滤波处理，得到宽带信号。本发明实施例既保证了扩频效果，保证语音质量，还可应用部署于要求时延低，内存小、计算能力较弱的通信设备。
基于深度学习注意力机制频带扩展方法装置

[发明专利]基于线性滤波的频带扩展方法、装置及会议终端系统-CN202010933315.7在审
发明人： 方泽煌;康元勋 -专利权人：厦门亿联网络技术股份有限公司
申请日： 2020-09-08 - 公布日： 2021-01-08 - 主分类号： G10L19/04 文献下载
摘要：本发明实施例公开一种基于线性滤波的频带扩展方法、装置及会议终端系统，所述方法包括：对样本窄带语音信号进行上采样处理，得到采样后的时域语音信号；提取所述时域语音信号的LPC系数和LPC残差；利用所述LPC系数对待扩频的语音信号进行一阶FIR滤波器滤波，得到残差语音信号；根据所述LPC残差和所述LPC系数确定脉冲响应信号；利用所述残差语音信号生成宽带激励信号；对所述脉冲响应信号进行傅里叶变换，得到傅里叶变换结果；将所述宽带激励信号和所述傅里叶变换结果进行相乘，并对相乘结果进行逆傅里叶变换，得到频带扩展后的宽带信号。本发明实施例既能够降低计算开销、占用内存，且相比于传统频带扩展方法，能够提升语音质量、适用于各种编解码场景。
基于线性滤波频带扩展方法装置会议终端系统

[发明专利]语音命令词识别方法、装置、会议终端及会议终端系统-CN202010491988.1在审
发明人： 方泽煌;康元勋 -专利权人：厦门亿联网络技术股份有限公司
申请日： 2020-06-02 - 公布日： 2020-10-20 - 主分类号： G10L15/22 文献下载
摘要：本发明公开一种语音命令词识别方法、装置、会议终端及会议终端系统，所述方法包括：提取语音信号的MFCC特征并将所述MFCC特征输入到采用隐马尔可夫模型建立的预先训练好的声学模型，获得相应的三音素后验概率，并根据所述三音素后验概率，采用预先训练好的n‑gram语言模型构建解码网络并进行解码运算，搜索最优路径，获得期望输出的命令词识别结果；再通过对所述最优路径的权重进行累加统计，获得所述命令词识别结果的置信度，最后根据所述置信度判断所述命令词识别结果是否可信，若可信，则输出所述命令词识别结果，否则，拒识所述命令词识别结果。本发明能够在只有少量的训练数据下，依然能够获得准确的识别效果。
语音命令识别方法装置会议终端系统

[发明专利]一种生成混响衰减参数模型的方法及计算系统-CN202010016844.0在审
发明人： 方泽煌;康元勋 -专利权人：厦门亿联网络技术股份有限公司
申请日： 2020-01-08 - 公布日： 2020-06-05 - 主分类号： G10L21/0208 文献下载
摘要：本发明公开了一种生成混响衰减参数模型的方法及计算系统，属于音频信号处理技术领域。本发明方法为：先采集语音数据和RIR数据，再将语音数据和RIR数据合成得到混响语音数据；之后对混响语音数据进行处理得到J帧，每帧提取H维特征；再利用RNN模型对J帧及每帧提取的H维特征进行训练得到混响衰减参数模型。本发明的系统包括采集单元、计算单元和存储单元，采集单元和计算单元电连接；计算单元通过传输单元与存储单元连接；本发明的目的在于克服现有技术中，不能准确计算实时的混响衰减参数的不足，本发明可以实时计算室内的混响衰减参数，对于室内环境变化的适应能力较强，进而可以提高混响消除的效果。
一种生成混响衰减参数模型方法计算系统

[发明专利]一种生成混响语音数据的方法和系统-CN202010016814.X在审
发明人：康元勋;方泽煌 -专利权人：厦门亿联网络技术股份有限公司
申请日： 2020-01-08 - 公布日： 2020-05-29 - 主分类号： G10L13/02 文献下载
摘要：本发明公开了一种生成混响语音数据的方法和系统，属于语音数据生成领域。本发明的方法为：先采集语音数据，并采用仿真的方式生成RIR数据；之后对语音数据进行处理，再通过卷积运算将处理后的语音数据和RIR数据合成混响语音数据。本发明的系统包括采集单元、计算单元和存储单元，采集单元与计算单元电连接，计算单元通过传输单元与存储单元连接。本发明的目的在于克服现有技术中，不能生成大量的混响语音数据，导致深度学习所需的混响语音数据匮乏的不足，提供了一种生成混响语音数据的方法和系统，可以生成批量的混响语音数据，从而满足深度学习对混响语音数据的需求。
一种生成混响语音数据方法系统

[发明专利]一种语音晚期混响抑制方法及系统-CN202010016846.X在审
发明人： 方泽煌;康元勋 -专利权人：厦门亿联网络技术股份有限公司
申请日： 2020-01-08 - 公布日： 2020-05-19 - 主分类号： G10L21/0208 文献下载
摘要：本发明公开了一种语音晚期混响抑制方法及系统，属于语音处理技术领域。本发明的方法为先采集室内的混响语音信号，提取混响衰减参数；再根据混响衰减参数计算混响频谱特征a；之后根据混响频谱特征a及朴素谱减法计算混响抑制后的语音频谱特征b；然后对语音频谱特征b进行插值计算，利用混响语音信号的相位特征对语音频谱特征b进行还原得到波形语音，并输出该波形语音。本发明的系统包括采集单元、计算单元、传输单元和终端，采集单元与计算单元电连接，计算单元和终端分别与传输单元连接；本发明的目的在于克服现有技术中，语音晚期混响抑制方法不能适应时变的混响环境的不足，本发明可以适应时变的混响环境，稳定抑制晚期混响。
一种语音晚期混响抑制方法系统

[发明专利]一种生成混合语音数据的方法及系统-CN201910394160.1在审
发明人：康元勋;方泽煌;冯万健 -专利权人：厦门亿联网络技术股份有限公司
申请日： 2019-05-13 - 公布日： 2019-10-11 - 主分类号： G10L15/26 文献下载
摘要：本发明公开了一种生成混合语音数据的方法及系统，属于语音识别技术领域。本发明的一种生成混合语音数据的方法，先采集纯净语音和噪声，再将采集的语音数据进行归一化处理，而后对处理后的数据进行随机化处理，再对数据进行GAIN处理，最后经过滤波器处理得到混合语音数据。本发明的一种生成混合语音数据的系统，包括采集单元、计算单元和存储单元，所述采集单元与计算单元电连接，计算单元通过数据传输单元与存储单元连接。本发明的目的在于克服现有技术中，深度学习所需的音频数据匮乏的不足，提供了一种生成混合语音数据的方法及系统，可以自动生成混合语音数据，可以满足深度学习的数据需求。
混合语音数据计算单元采集单元存储单元数据传输单元语音识别技术采集归一化处理滤波器处理随机化处理纯净语音数据需求音频数据语音数据自动生成电连接噪声学习

[发明专利]一种基于神经网络的机械臂自适应控制方法-CN201810319733.X在审
发明人：李俊;方泽煌 -专利权人：福建省德腾智能科技有限公司
申请日： 2018-04-11 - 公布日： 2018-09-28 - 主分类号： G05B13/04 文献下载
摘要：本发明首先以所述机械臂基座的世界坐标系为所述空间的坐标系，采用八叉树算法对所述空间建模，该空间完全覆盖该机械臂的运动空间，通过神经网络的结构特征建立基于该空间的神经网，采用D‑H法对所述机械臂建模，利用该D‑H法参数，建立基于该机械臂的神经网；其次，随机获取所述机械臂末端位置，通过一种映射方法，使所述机械臂层与所述空间层关联；再次，在所述空间范围内，基于所述空间神经网预设步长训练轨迹模型；最后，采用BP方法规划最短路径，根据所述两层神经网的映射关系，计算所述机械臂神经元的最优组合，控制机械臂以规划路径运动。
机械臂所述空间神经网神经网络建模神经元机械臂末端世界坐标系自适应控制规划路径轨迹模型映射关系运动空间最短路径最优组合树算法两层映射预设关联规划

1
共 15 条