专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果17个,建议您升级VIP下载更多相关专利
  • [发明专利]语音识别方法、装置、设备、存储介质及程序产品-CN202310572229.1在审
  • 唐立亮;曹立新;金明杰 - 腾讯科技(深圳)有限公司
  • 2023-05-19 - 2023-10-27 - G10L15/26
  • 本申请公开了一种语音识别方法、装置、设备、存储介质及程序产品,涉及计算机技术领域。该方法包括:获取音频数据;基于音频数据的发音内容预测音频数据表征的第一文本内容;响应于多个文本字符中的第一文本字符存在于预先采集的发音混淆字符列表中,确定与第一文本字符存在发音混淆关系的第二文本字符;确定第一文本内容对应的第一语义预测得分,以及确定包括第二文本字符的第二文本内容对应的第二语义预测得分;基于第一语义预测得分和第二语义预测得分确定语音识别文本。通过以上方式,能够分析文本内容是否存在发音混淆问题,尽早对识别错误的字符进行纠正,有效提升语音识别正确率。本申请可应用于云技术、人工智能、智慧交通等各种场景。
  • 语音识别方法装置设备存储介质程序产品
  • [发明专利]语音识别方法、装置、电子设备及可读存储介质-CN202011205969.4有效
  • 唐立亮 - 腾讯科技(深圳)有限公司
  • 2020-11-02 - 2022-09-06 - G10L15/02
  • 本申请实施例提供了一种语音识别方法、装置、电子设备及可读存储介质,该方法涉及人工智能技术领域。该方法包括:获取待识别语音数据的声学特征信息和语言特征信息;根据声学特征信息和语言特征信息,在预构静态词图中确定待识别语音数据匹配的目标识别路径,并记录待识别语音数据的候选识别路径中各词节点的词节点信息;根据目标识别路径获得待识别语音数据的语音识别结果;基于语音识别结果中各识别词的词标识、以及候选识别路径中各词节点的词节点信息,按照目标识别路径进行回溯,得到语音识别结果中各识别词在待识别语音数据中的词边界信息。在本申请实施例中,在得到语音识别结果的同时便可得到词边界信息,减少了识别词边界信息的耗时。
  • 语音识别方法装置电子设备可读存储介质
  • [发明专利]一种语音验证处理的方法以及相关装置-CN202210453885.5在审
  • 朱绍明;袁添文;杜念冬;唐立亮 - 腾讯科技(深圳)有限公司
  • 2022-04-27 - 2022-06-21 - G10L15/00
  • 本申请实施例公开了一种语音验证处理的方法以及相关装置,可应用于人工智能等领域,能够有效地提高与待验证语音对应的说话对象的识别准确度,提升用户体验程度。前述方法包括:获取终端设备发送的待验证信息,待验证信息包括待验证语音、对象标识码以及设备标识码;通过预设模型版本号所对应的神经网络模型确定待验证语音所对应的声纹特征向量;计算声纹特征向量与每个候选声纹特征向量之间的声纹相似度;从声纹特征向量与每个候选声纹特征向量之间的声纹相似度中确定目标声纹相似度;在目标声纹相似度大于或等于预设相似阈值时,向终端设备发送验证通过消息,验证通信消息包括对象标识码。
  • 一种语音验证处理方法以及相关装置
  • [发明专利]语音识别方法和装置-CN202210080184.1在审
  • 马东鹏;苏丹;唐立亮 - 腾讯科技(深圳)有限公司
  • 2022-01-24 - 2022-04-26 - G10L15/26
  • 本申请公开了一种语音识别方法和装置,属于计算机技术领域。该方法包括:对目标音频数据中的每个音频帧进行特征提取,得到每个音频帧对应的特征信息;基于每个音频帧对应的特征信息和语音识别模型,确定目标音频数据对应的文本和文本中的每个文字对应的第一时间信息;基于每个音频帧对应的特征信息和主人声识别模型,确定每个音频帧对应的声音类型;基于目标音频数据对应的文本、每个文字对应的第一时间信息和每个音频帧对应的声音类型,确定目标音频数据对应的主人声文本。采用本申请,可以对目标音频数据(如音乐、视频或语音等所涉及的音频数据)中的主人声和背景人声进行区分,从而得到目标音频数据的主人声文本,提高了语音识别的准确性。
  • 语音识别方法装置
  • [发明专利]语音识别方法、装置、计算机设备及存储介质-CN202111536323.9在审
  • 唐立亮 - 腾讯科技(深圳)有限公司
  • 2021-12-15 - 2022-04-12 - G10L15/02
  • 本申请实施例公开了一种语音识别方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:获取语言信息,获取语音数据中的多个音频帧的语义特征,语义特征包括音频帧分别属于多个字符的第一概率;基于多个语义特征中区分度大于第一阈值的语义特征,从语言信息中提取与语音数据匹配的语义路径,将语义路径确定为语音数据的语义信息。本申请实施例提供的方法,从多个语义特征中筛选出区分度满足要求的语义特征,结合语言信息中各个字符之间的连接关系,从语言信息中提取出与该语音数据匹配的语义路径,作为识别到的语义信息,无需再对不满足区分度条件的语义特征进行处理,从而提升了语音识别效率,也保证了识别结果的准确性。
  • 语音识别方法装置计算机设备存储介质
  • [发明专利]一种流式语音识别方法、装置、设备及存储介质-CN201910414688.0有效
  • 朱绍明;唐立亮 - 腾讯科技(深圳)有限公司
  • 2019-05-17 - 2021-06-22 - G10L15/02
  • 本申请公开了一种流式语音识别方法,包括:获取待识别的语音信号;对所述语音信号进行特征提取,获得语音特征;通过解码器基于声学模型和语言模型,对所述语音特征进行解码得到N个候选识别结果以及各自对应的解码得分;根据所述N个候选识别结果各自对应的置信度确定置信度阈值,所述候选识别结果对应的置信度包括声学模型得分、语言模型得分和解码得分中任一种;从所述N个候选识别结果中,筛选置信度大于所述置信度阈值的候选识别结果,生成目标候选识别结果集;根据所述目标候选识别结果集,确定所述语音信号的识别结果。如此,实现自适应输出最优实时结果,满足实时识别的业务需求,提高识别精度。本申请还公开了对应的装置、设备及介质。
  • 一种语音识别方法装置设备存储介质
  • [发明专利]语音识别方法、装置、计算机设备及存储介质-CN201910740387.7有效
  • 唐立亮 - 腾讯科技(深圳)有限公司
  • 2019-07-02 - 2020-12-11 - G10L15/22
  • 本发明公开了一种语音识别方法、装置、计算机设备及存储介质,属于人工智能技术领域。人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能软件技术包括语音技术,语音技术的关键技术有自动语音识别技术,自动语音识别技术是指自动识别人的语音以得到文字信息的过程。本发明通过仅基于第二数据包进行语音识别,减少了参与语音识别的数据包的数量,减少了运算时间。
  • 语音识别方法装置计算机设备存储介质
  • [发明专利]基于人工智能的语音唤醒方法和装置-CN201611248513.X有效
  • 唐立亮 - 百度在线网络技术(北京)有限公司
  • 2016-12-29 - 2020-06-23 - G10L15/22
  • 本发明提出一种基于人工智能的语音唤醒方法和装置,其中,方法包括:通过对各音素进行聚类,以选取出用于指代全部音素的垃圾音素,以及根据预先设定的唤醒词,构建与所述唤醒词相似的反唤醒词之后,根据垃圾音素、反唤醒词和唤醒词构建解码网络,从而可以利用该解码网络进行语音唤醒。由于垃圾音素的数据量明显少于垃圾词的数据量,解决了现有技术中垃圾词模型占用数据量过大的问题,同时,由于词汇是由有限个音素所构成的,因此,垃圾音素相较于垃圾词也更能够较为全面覆盖全部词汇提高了唤醒精度,减少误唤醒的概率。
  • 基于人工智能语音唤醒方法装置
  • [发明专利]基于人工智能的语音唤醒方法和装置-CN201611111477.2有效
  • 唐立亮 - 百度在线网络技术(北京)有限公司
  • 2016-12-02 - 2019-11-08 - G10L15/02
  • 本发明提出一种基于人工智能的语音唤醒方法和装置,其中,该语音唤醒方法,包括:获取自定义唤醒词对应的发音信息;获取所述发音信息对应的近似发音信息;根据预设的垃圾词列表、所述发音信息和所述近似发音信息构建唤醒词识别网络,以根据所述唤醒词识别网络对用户输入的语音进行识别,并根据识别结果确定是否执行唤醒操作。本发明的实施例,能够针对不同的自定义唤醒动态构建唤醒词识别网络,有效提升唤醒的正确率,并降低误报率,能够提升唤醒效率,内存占用更小,功耗低。
  • 基于人工智能语音唤醒方法装置
  • [发明专利]语音唤醒方法及装置-CN201610039038.9有效
  • 唐立亮 - 百度在线网络技术(北京)有限公司
  • 2016-01-20 - 2019-10-15 - G10L15/22
  • 本申请提出一种语音唤醒方法和装置,其中,该方法包括:获取用户输入的语音;采用跳帧策略对所述语音的数据帧进行处理,并通过时域能量算法对所述数据帧进行语音活动检测;提取所述语音的声学特征,根据预设的识别网络和声学模型对所述声学特征进行语音识别;若获知所述语音为所述识别网络中预设的唤醒词,则进行相应的操作。优化了语音唤醒的处理过程,能够在保证唤醒正确率不下降的前提下,极大的减少运算量,降低设备功耗,提高处理性能。
  • 语音唤醒方法装置
  • [发明专利]英文人名识别方法和装置-CN201510390421.4有效
  • 唐立亮;彭守业 - 百度在线网络技术(北京)有限公司
  • 2015-07-06 - 2017-11-17 - G10L15/26
  • 本发明提出一种英文人名识别方法和装置,该英文人名识别方法包括接收用户输入的语音,所述语音中包括英文人名;通过加载的中文识别声学模型和已构建的识别网络对所述用户输入的语音进行识别,获取所述语音的识别结果,所述语音的识别结果中包括所述英文人名的识别结果。由于无需进行额外的模型训练和语料收集等工作,本发明实现成本低,并且由于本发明加载的是中文识别声学模型,不会对用户输入的语音中非英文部分的识别产生影响,提高了整体的识别准确率,同时对英文人名的识别准确率也高于中英文模型混合识别的准确率。
  • 英文人名识别方法装置
  • [发明专利]语音识别方法及装置-CN201510427908.5有效
  • 唐立亮;贾磊;彭守业 - 百度在线网络技术(北京)有限公司
  • 2015-07-20 - 2017-11-03 - G10L15/183
  • 本发明公开了一种语音识别方法及装置,其中所述方法包括根据语音信息识别得到发音信息;根据所述查分树信息加载语言模型查分树,查询所述语言模型查分树确定与所述发音信息匹配的文字识别结果的概率得分;其中,所述查分树信息包括与文字对应的多个节点,每个节点至少包括当前节点与子节点之间的存储位置偏移量;根据所述概率得分选择文字识别结果,作为最终的识别结果。本发明实施例通过在启动时直接根据当前节点与子节点之间的存储位置偏移量加载语言模型查分树,这样大大的缩短了启动时间。
  • 语音识别方法装置
  • [发明专利]语音唤醒方法和装置-CN201510399209.4有效
  • 唐立亮;贾磊;彭守业;牛建伟 - 百度在线网络技术(北京)有限公司
  • 2015-07-08 - 2017-07-25 - G10L15/02
  • 本发明公开了一种语音唤醒方法和装置,其中,语音唤醒方法包括S1、获取唤醒词,并根据唤醒词生成符合预设条件的垃圾词,以及根据唤醒词和垃圾词构建识别网络;S2、获取用户输入的语音信息,将语音信息切分为多个语音帧,并提取每个语音帧中的声学特征;S3、基于卷积神经网络声学模型对多个声学特征依次进行似然计算,以获得每个声学特征的声学特征得分;S4、根据声学特征得分从识别网络中选取最优识别路径,以及将最优识别路径对应的语音结果作为识别结果;以及S5、根据识别结果计算识别结果对应的置信度,并根据置信度获得唤醒结果并输出。本发明实施例的语音唤醒方法和装置,计算量小,功耗低,能够降低语音唤醒的误报率,提升用户使用体验。
  • 语音唤醒方法装置

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top