“杭州芯声智能科技有限公司”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果25个，建议您升级VIP下载更多相关专利

[发明专利]一种自适应阵列麦克风降噪装置-CN202211214822.0在审
发明人：郭东风 -专利权人： 杭州芯声智能科技有限公司
申请日： 2022-09-30 - 公布日： 2023-07-14 - 主分类号： H04R3/04 文献下载
摘要：本发明提供一种自适应阵列麦克风降噪装置，涉及音频处理技术领域。本发明在阵列麦克风上部署有信号预处理模块、自适应滤波器组、DOA方向估计模块、滤波输出选择模块、进一步降噪模块和OLA重叠相加模块；当噪声信号在某些位置频繁变换的时候，根据事先配置或者由估计的DOA得到的统计信息配置多方向的辅助滤波器。辅助滤波器一直在后台根据DOA信息更新。这样不需要重新从头跟踪，滤波器可以迅速起到作用降噪。
一种自适应阵列麦克风装置

[发明专利]一种基于深度神经网络的自动语音识别方法-CN202110599305.9有效
发明人：王蒙;付志勇;胡奎;姜黎;潘艾婷 -专利权人： 杭州芯声智能科技有限公司
申请日： 2021-05-31 - 公布日： 2023-05-12 - 主分类号： G10L15/02 文献下载
摘要：本发明提供的一种基于深度神经网络的自动语音识别方法，涉及自动语音识别领域。本发明通过采用Log Fbank作为声学特征，只需要40维特征就足够表达声学信号的特征，极大的简化的信号的处理过程和神经网络模型的大小；采用VGG加双向GRU结合的神经网络模型，加上GRU可以充分的利用语音前后帧的信息，从而得到最佳的识别效果。明通过CTC解码是将连续的相同结果合并，去除多余结果，并通过预先定义好的拼音列表映射得到识别出的拼音序列，无需对齐，免除人工对齐操作；通过采用隐马尔科夫语言模型，将拼音序列作为模型输入，并得到对应的文字识别结果；能给出同一个拼音对应不同文字的最佳识别结果，使自动语音识别的准确性大大提升。
一种基于深度神经网络自动语音识别方法

[发明专利]一种ARM侧离线语音合成的方法、装置及存储介质-CN202110599311.4有效
发明人：张毅;胡奎;姜黎 -专利权人： 杭州芯声智能科技有限公司
申请日： 2021-05-31 - 公布日： 2023-04-25 - 主分类号： G10L13/08 文献下载
摘要：本发明提供的一种ARM侧离线语音合成的方法、装置及存储介质，涉及语音合成技术领域。本发明通过对ARM侧设备部署音素序列生成器、音素—时间标签序列生成器、声学特征生成器和声码器来进行离线语音合成，通过对ARM侧设备部署的各生成器进行进行Python toc/c++porting重编译和对Tensorflow平台的32位float型模型浮点参数进行量化压缩，使ARM侧设备能够快速进行离线语音合成且达到节省ARM侧设备所需部署空间、降低ARM侧设备运算要求的目的；通过通过将MelGAN模型作为神经网络声码模型，达到了提升训练速率，在没有额外的蒸馏和感知损失的引入下仍能产生高质量的语音合成模型；将Fastspeech 2模型神经网络声学特征生成模型能达到升模型训练速率和增加了数据的丰富度避免过多的信息损失的目的。
一种 arm 离线语音合成方法装置存储介质

[发明专利]一种基于姿态传感器的语音活动检测方法-CN202110646290.7有效
发明人：王蒙;胡奎;姜黎 -专利权人： 杭州芯声智能科技有限公司
申请日： 2021-06-10 - 公布日： 2023-04-25 - 主分类号： G10L15/02 文献下载
摘要：本发明提供的一种基于姿态传感器的语音活动检测方法，涉及人机交互技术领域。本发明通过将姿态特征数据与声音特征数据进行特征拼接，得到混合特征数据；通过混合特征数据对神经网络模型进行训练，能实现在不同姿态下对语音活动进行准确检测，解决了用户姿态会影响语音活动检测准确度的问题；通过量化压缩方法中的三值量化方法对训练完成的神经网络量进行量化压缩，将32bit浮点型权值量化为2bit定点型权值，进一步减少其占用内存大小的同时还极大地减小了对于计算空间和时间的消耗；使用循环神经网络模型来构建前后帧的数据联系，以提高模型效果；且循环神经网络模型参数量较少，进一步减少其占用内存大小。
一种基于姿态传感器语音活动检测方法

[实用新型]一种骑行头盔耳机及具有该耳机的骑行头盔-CN202223488499.4有效
发明人：范甫群;姜黎 -专利权人： 杭州芯声智能科技有限公司
申请日： 2022-12-22 - 公布日： 2023-04-07 - 主分类号： H04R1/10 文献下载
摘要：本实用新型实施例公开了一种骑行头盔耳机及具有该耳机的骑行头盔。该骑行头盔耳机包括主耳机；所述主耳机包括主耳机机壳、主控电路板、扬声器和主耳机受话器；所述扬声器和所述主耳机受话器与所述主控电路板电连接；并且，所述扬声器、所述主耳机受话器和所述主控电路板集成于所述主耳机机壳内。本实用新型实施例的骑行头盔耳机及具有该耳机的骑行头盔通过将耳机主控部分与扬声器和受话器集合在一起，可以降低成本、提高抗风噪能力及配戴体验感。
一种行头耳机具有

[外观设计]头盔耳机-CN202230854317.7有效
发明人：范甫群;姜黎 -专利权人： 杭州芯声智能科技有限公司
申请日： 2022-12-22 - 公布日： 2023-04-07 - 主分类号： 14-01 文献下载
摘要：1.本外观设计产品的名称：头盔耳机。2.本外观设计产品的用途：用于安装在头盔上的耳机。3.本外观设计产品的设计要点：在于形状。4.最能表明设计要点的图片或照片：组件1立体图1。
头盔耳机

[发明专利]一种基于自定义关键词的声纹识别方法-CN202211212050.7在审
发明人：张毅;龚永康 -专利权人： 杭州芯声智能科技有限公司
申请日： 2022-09-30 - 公布日： 2023-03-21 - 主分类号： G10L17/14 文献下载
摘要：本发明提供的一种基于自定义关键词的声纹识别方法，涉及音频识别技术领域。本发明通过声纹数据标记、模型训练、声纹注册和声纹验证的方法实现了一种低计算量、低功耗、高识别率、无云服务支持的离线、本地声纹识别方法；本发明使用一种帧级别音频特征比对方法进行音频粗比对是否是同一关键词，在包含声纹训练数据收集、声纹数据注册、用户声纹验证过程中，进行一个低计算量、较高检错率的用户声纹音频粗识别，以达到在使用声纹神经网络模型之前就能够将一些干扰音频剔除在外；使用一种低参数、低计算量的声纹神经网络模型进行本地音频声纹特征提取；本申请设计所有算法模型都可部署在同一、离线、本地的存储介质上，且无需与云服务器进行交互。
一种基于自定义关键词声纹识别方法

[发明专利]一种基于可穿戴设备的神经网络多命令词识别方法及系统-CN202210888530.9在审
发明人：纪盟盟;王蒙;胡光敏;龚永康 -专利权人： 杭州芯声智能科技有限公司
申请日： 2022-07-27 - 公布日： 2022-12-09 - 主分类号： G10L15/22 文献下载
摘要：本发明提供一种基于可穿戴设备的神经网络多命令词识别方法及系统，涉及音频处理技术领域。本发明使用神经网络技术，在训练数据中进行多种噪声的混合，提升识别准确率和鲁棒性；使用语音的MFCC特征作为网络的输入，在网络的第一层，使用CNN进行特征提取，使用CNN可以进行权重共享，可以很大程度减少网络的参数量，随后加一层GRU层，可以充分利用语音段中前面帧之间的信息，通过该步骤能得到帧间特征，从而提升系统的整体识别度和识别效率；使用VAD人声检测模块进行人声检测，没有人声时多命令词检测算法不工作，可以减少系统的功耗；GRU状态的重置可以使之和训练情况相同，从而保证算法的识别准确率和鲁棒性。
一种基于穿戴设备神经网络命令识别方法系统

[发明专利]一种基于神经网络双讲检测的回声消除方法及系统-CN202210888604.9在审
发明人：姜黎;龚永康;胡奎;孙江涛 -专利权人： 杭州芯声智能科技有限公司
申请日： 2022-07-27 - 公布日： 2022-12-09 - 主分类号： G10K11/178 文献下载
摘要：本发明提供一种基于神经网络双讲检测的回声消除方法及系统，涉及音频处理技术领域。本发明通过使用双讲检测结果控制线性前处理中自适应滤波器的更新与否；当检测到远端无人声信号时，停止更新自适应滤波器。防止双讲状态或是远端仅存在环境噪声时自适应滤波器由于受到扰动偏离稳定点而发散；通过使用双讲检测结果控制非线性后处理中对于回声的最大抑制量，在检测到近端与远端人耳同时讲话时，结合人耳的听觉掩蔽效应估算出能够掩蔽残留回声所需的最大抑制量。在保留近端有用信号失真度小的同时，残留回声也得到有效抑制；在检测到仅有远端人耳信号单讲时，提升对残留回声信号的抑制，使得残留回声能被彻底去除干净。
一种基于神经网络检测回声消除方法系统

[发明专利]一种带有延时估计功能的回声消除系统-CN202210895391.2在审
发明人：胡奎;姜黎;郭东风;高华能 -专利权人： 杭州芯声智能科技有限公司
申请日： 2022-07-27 - 公布日： 2022-12-09 - 主分类号： G10K11/178 文献下载
摘要：本发明提供一种带有延时估计功能的回声消除系统，涉及音频处理技术领域。本发明通过使用延时估计模块对设备的声学场景中的近端信号与远端参考信号之间的延时进行估计，锁定延时后设定合理的缓冲区延时参数，防止远端参考信号滞后于近端回声信号从而提升回声消除的性能；使用幅度检测模块检测检测麦克输入与参考输入幅值，合理调整麦克与参考输入相对幅值大小，使待估计的自适应滤波器系数处于最佳动态范围，防止有效字长效应造成迭代累计误差，同时可以加快滤波器收敛速度；结合幅度检测模块进行截项失真检测，控制自适应滤波器系数冻结更新，防止截顶失真或者破音等非线性扰动造成滤波器发散；使用动态调整的步长和正则化因子，收敛更加迅速。
一种带有延时估计功能回声消除系统

[发明专利]一种基于骨传导耳机的多命令词语音唤醒方法-CN202210895394.6在审
发明人：王蒙;胡奎;孙江涛;姜黎 -专利权人： 杭州芯声智能科技有限公司
申请日： 2022-07-27 - 公布日： 2022-12-09 - 主分类号： G10L15/22 文献下载
摘要：本发明提供一种基于骨传导耳机的多命令词语音唤醒方法，涉及音频处理技术领域。本发明根据源数据的长度进行统计来确定的训练长度，得到的长度可以涵盖大部分的训练样本，这样既不会浪费训练数据，也不容易造成冗余；采用归一化通道能量PCEN特征训练，PCEN特征比MFCC特征更加适合神经网络的训练；在模型的选择上增加了一层CNN，用神经网络提取得到的特征更加适合训练神经网络；使模型更加小巧，计算量成倍减小，采用的是累计预测值的大小和次数，当预测值连续几帧都大于设定的阈值时判定为检测到关键词。这种方案相比与滑窗机制，在预测方面识别率会稍有下降，但是计算量缩小将近百倍，方便部署在小型设备上。
一种基于传导耳机命令词语唤醒方法

[发明专利]一种基于骨声纹传感器的VAD方法及系统-CN202210903492.X在审
发明人：龚永康;张毅;纪盟盟;王蒙 -专利权人： 杭州芯声智能科技有限公司
申请日： 2022-07-28 - 公布日： 2022-12-09 - 主分类号： G10L25/87 文献下载
摘要：本发明提供一种基于骨声纹传感器的VAD方法及系统，涉及音频处理技术领域。本发明使用神经网络技术，并结合骨声纹传感器进行数据采集；在训练数据中进行AEC残留语音与环境噪声的混合，提升识别准确率和鲁棒性；本发明使用语音的MFCC特征作为网络的输入，GRU层可以充分利用语音段中前面帧之间的信息，使语音特征之间的提取更加充分，最后使用一个Dense层进行分类，通过该步骤能得到帧间特征，从而提升系统的整体识别度和识别效率；本发明通过对训练集获取标签集，再将模型训练输出通过对应的帧标签计算损失，再进行梯度反传优化模型；得到的概率预测模型相较于没有进行梯度反传优化模型的模型，其准确度大大提高。
一种基于声纹传感器 vad 方法系统

[发明专利]一种基于参数共享的自然语言理解方法-CN202211215476.8在审
发明人：胡光敏 -专利权人： 杭州芯声智能科技有限公司
申请日： 2022-09-30 - 公布日： 2022-12-06 - 主分类号： G06F16/332 文献下载
摘要：本发明提供一种基于参数共享的自然语言理解方法，涉及音频处理技术领域。本发明通过建立具备多个编码器的自然语言理解模型，并在反向传播时按照预设顺序依次对编码器中的参数进行更新共享，从而实现低计算量、低功耗、高识别率等优点。使用参数共享的方法来构建自然语言理解模型，通过参数共享的方式在不增加网络参数的前提下，加深网络深度，从而使得模型具有更好的非线性，能拟合更为负责的训练数据。将自然语言理解的输出意图进行再编码表示后，与语义槽的特征向量进行交互。从而达到通过意图列表约束语义槽输出的目的。本发明设计所有算法模型都可部署在同一、离线、本地的存储介质上，且无需与云服务器进行交互。
一种基于参数共享自然语言理解方法

[发明专利]一种SOC多时钟无毛刺切换电路-CN202210888529.6在审
发明人：张伟;姜黎 -专利权人： 杭州芯声智能科技有限公司
申请日： 2022-07-27 - 公布日： 2022-11-22 - 主分类号： G06F1/04 文献下载
摘要：本发明提供一种SOC多时钟无毛刺切换电路，涉及SOC集成电路领域。本发明通过硬件电路的设置，简化多时钟切换时所需的步骤，系统对时钟进行切换时，仅需在系统寄存器内设置对应的时钟编码，时钟编码通过第一编码器编译为one‑hot编码的时钟编码，并分别交给各时钟支路；各时钟支路根据时钟编码判断是否与自身连接的时钟匹配，若匹配，则将对应时钟进行输出，完成时钟切换；本发明仅需要设置对应的系统寄存器，对于软件层来讲，无需关注时钟切换步骤便能获得想要的时钟，从而解决现有技术切换方式需要分几个步骤进行的问题。此外，本发明还设置了时钟指示单元，系统通过对时钟指示单元输出信号进行读取，便能得知当前的真实时钟。
一种 soc 多时毛刺切换电路

[发明专利]一种双注意力训练序列生成方法、装置及可读存储介质-CN202110646605.8有效
发明人：胡光敏;娄坤;姜黎 -专利权人： 杭州芯声智能科技有限公司
申请日： 2021-06-10 - 公布日： 2022-09-20 - 主分类号： G06K9/62 文献下载
摘要：本发明提供的一种双注意力训练序列生成方法、装置及可读存储介质，涉及计算机深度学习领域。本发明通过构建面向输入文本中字符的重要度和输入文本中字符对应槽值关联度的双注意力机制模型来生成对应输入文本的双注意力训练序列，槽值关联度根据槽值的query释义矩阵作为先验知识进行衡量，能使训练序列同时具备重要度特征和关联度特征；本发明通过Bi‑lstm层使训练序列前后关联，并计算其权重占比，从而得到输入文本中字符的重要度，将该训练序列作为训练数据能得到对重要信息关注度更好的模型；本发明通过双序列标注法减少了传统标注法所使用到的槽值标签数目，有助于训练模型的拟合和效率提升。
一种注意力训练序列生成方法装置可读存储介质

1
2
下一页»
尾页
共 25 条