专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果48个,建议您升级VIP下载更多相关专利
  • [发明专利]语音唤醒方法和装置-CN202011630785.2在审
  • 薛少飞 - 苏州思必驰信息科技有限公司
  • 2020-12-31 - 2021-05-07 - G10L17/22
  • 本发明公开语音唤醒方法和装置,其中,一种语音唤醒方法,包括:将原始音频输入至使用sinc函数来构造带通滤波器,其中,所述滤波器形成特殊卷积层,所述滤波器的参数为最高截止频率和最低截止频率;将经过所述滤波器处理后的音频依次经过多重处理并最终输入到第一DNN层,其中,所述第一DNN层与记忆块连接,所述记忆块种存储有从当前时刻往前N帧至往后M帧的数据;将所述记忆块种存储的数据与所述第一DNN层的输出数据求和之后经过第一激活函数处理后作为第二DNN层的输入,其中,所述第二DNN层的数量和所述记忆块的数量为大于等于1的自然数;以及将最后一个第二DNN层输出的数据经过第二激活函数的处理得到最终输出后验得分。
  • 语音唤醒方法装置
  • [发明专利]语音识别系统及方法-CN202011088752.X有效
  • 吴旭貌;薛少飞 - 苏州思必驰信息科技有限公司
  • 2020-10-13 - 2021-02-02 - G10L15/26
  • 本发明实施方式中提供一种语音识别系统。语音识别系统包括:一个语音识别单元和一个发音对比单元。语音识别单元利用多路并行识别架构可以通过接收输入语音信号同时获得多路的语音识别字符串。发音对比单元获取当前值距离度量值S/L且根据当前S/L和给定的阈值判断后获取最终语音识别输出字段。同时本发明还提供了一种语音识别方法。从而,本发明中的语音识别系统可以避免很多客户提供定制文本带来的不确定性,并且很好的提升了识别系统的体验。
  • 语音识别系统方法
  • [发明专利]基于神经网络的声纹信息提取方法及装置-CN201610421908.9有效
  • 薛少飞 - 阿里巴巴集团控股有限公司
  • 2016-06-13 - 2020-12-18 - G10L25/30
  • 本发明揭示了一种基于神经网络的声纹信息提取方法及装置,其中,所述方法包括:对输入的语音片段提取语音声学特征;将所述语音声学特征输入基于神经网络训练的声纹模型中,并提取所述声纹模型中神经网络的瓶颈特征;将所述神经网络的瓶颈特征的各帧矢量映射为单帧声纹表达矢量,作为与所述输入的语音片段对应的声纹信息。本发明的基于神经网络的声纹信息提取方法及装置,通过基于神经网络训练的声纹模型对语音片段提取声纹信息,提取过程较为简单,且能够更好的处理短时语音片段。
  • 基于神经网络声纹信息提取方法装置
  • [发明专利]音频识别、回声消除方法、装置及设备-CN201710081881.8有效
  • 薛少飞;田彪 - 阿里巴巴集团控股有限公司
  • 2017-02-15 - 2020-10-09 - H04R3/00
  • 本申请提供一种音频识别、回声消除方法、装置及设备,所述回声消除方法包括:获取音箱数据和麦克风数据;若所述音箱数据不为空时,将所述音箱数据和所述麦克风数据输入预先生成的种类判断模型,根据判断结果确定所述麦克风数据的种类;在种类为非双讲型时,调整滤波器系数;在种类为双讲型时,固定滤波器系数,并对所述麦克风数据进行回声消除;其中,所述种类判断模型以音箱样本数据、麦克风样本数据作为分类器的输入参数,并以麦克风样本数据的种类作为分类器的分类目标训练生成,所述麦克风样本数据基于音箱样本数据生成。应用本申请方案可以提高判断麦克风数据的种类准确性,进而提高回声消噪效果。
  • 音频识别回声消除方法装置设备
  • [发明专利]语音识别方法及装置-CN201610509783.5有效
  • 薛少飞 - 阿里巴巴集团控股有限公司
  • 2016-06-30 - 2020-09-08 - G10L15/06
  • 本发明提供了一种语音识别方法及装置,其中的方法包括:针对训练数据特征矢量进行聚类处理,得到聚类训练数据特征矢量;利用所述聚类训练数据特征矢量对待识别数据特征矢量进行插值计算;将经过所述插值计算后的待识别数据特征矢量输入到语音识别模型,用于对语音识别模型的自适应调整。本发明可提高语音识别自适应的准确性和处理效率。
  • 语音识别方法装置
  • [发明专利]语音识别方法和设备-CN201811000407.9在审
  • 薛少飞 - 阿里巴巴集团控股有限公司
  • 2018-08-30 - 2020-03-10 - G10L15/187
  • 本申请提供了一种语音识别方法和设备,其中,该方法包括:获取语音数据;通过多个方言语音识别模型组件对所述语音数据并行进行识别,得到用于多个语言方言的识别结果和置信度值;通过场景相关度判别模型,确定用于多个语言方言的识别结果属于目标场景的相关度值;对置信度和相关度进行融合判断,确定所述语音数据的方言识别结果。本申请的方案通过方言确定和场景确定相融合的方式,从而提升了方言确定的准确性,解决了现有的先进行识别模型的选择而导致的如果识别模型选择错误,将会导致后续的语音识别结果都会出错的问题,达到了有效提升语音识别结果准确性的技术效果。
  • 语音识别方法设备

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top