“唐立亮”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果17个，建议您升级VIP下载更多相关专利

[发明专利]语音识别方法、装置、设备、存储介质及程序产品-CN202310572229.1在审
发明人： 唐立亮;曹立新;金明杰 -专利权人：腾讯科技（深圳）有限公司
申请日： 2023-05-19 - 公布日： 2023-10-27 - 主分类号： G10L15/26 文献下载
摘要：本申请公开了一种语音识别方法、装置、设备、存储介质及程序产品，涉及计算机技术领域。该方法包括：获取音频数据；基于音频数据的发音内容预测音频数据表征的第一文本内容；响应于多个文本字符中的第一文本字符存在于预先采集的发音混淆字符列表中，确定与第一文本字符存在发音混淆关系的第二文本字符；确定第一文本内容对应的第一语义预测得分，以及确定包括第二文本字符的第二文本内容对应的第二语义预测得分；基于第一语义预测得分和第二语义预测得分确定语音识别文本。通过以上方式，能够分析文本内容是否存在发音混淆问题，尽早对识别错误的字符进行纠正，有效提升语音识别正确率。本申请可应用于云技术、人工智能、智慧交通等各种场景。
语音识别方法装置设备存储介质程序产品

[发明专利]一种语音识别方法及其装置、设备和存储介质-CN201811498047.X有效
发明人： 唐立亮 -专利权人：腾讯科技（深圳）有限公司
申请日： 2018-12-07 - 公布日： 2023-05-09 - 主分类号： G10L15/01 文献下载
摘要：本申请实施例提供一种语音识别方法及其装置、设备和存储介质，其中，所述方法包括：确定语音数据的声学模型得分和语言模型得分；根据所述语音数据的声学模型得分和语言模型得分，对预设词图中的节点进行筛选，得到目标词图；在所述目标词图中，确定第一综合得分满足第一预设条件的路径；根据所述第一综合得分满足第一预设条件的路径，确定所述语音数据的语音识别结果。
一种语音识别方法及其装置设备存储介质

[发明专利]语音识别方法、装置、电子设备及可读存储介质-CN202011205969.4有效
发明人： 唐立亮 -专利权人：腾讯科技（深圳）有限公司
申请日： 2020-11-02 - 公布日： 2022-09-06 - 主分类号： G10L15/02 文献下载
摘要：本申请实施例提供了一种语音识别方法、装置、电子设备及可读存储介质，该方法涉及人工智能技术领域。该方法包括：获取待识别语音数据的声学特征信息和语言特征信息；根据声学特征信息和语言特征信息，在预构静态词图中确定待识别语音数据匹配的目标识别路径，并记录待识别语音数据的候选识别路径中各词节点的词节点信息；根据目标识别路径获得待识别语音数据的语音识别结果；基于语音识别结果中各识别词的词标识、以及候选识别路径中各词节点的词节点信息，按照目标识别路径进行回溯，得到语音识别结果中各识别词在待识别语音数据中的词边界信息。在本申请实施例中，在得到语音识别结果的同时便可得到词边界信息，减少了识别词边界信息的耗时。
语音识别方法装置电子设备可读存储介质

[发明专利]一种语音验证处理的方法以及相关装置-CN202210453885.5在审
发明人：朱绍明;袁添文;杜念冬;唐立亮 -专利权人：腾讯科技（深圳）有限公司
申请日： 2022-04-27 - 公布日： 2022-06-21 - 主分类号： G10L15/00 文献下载
摘要：本申请实施例公开了一种语音验证处理的方法以及相关装置，可应用于人工智能等领域，能够有效地提高与待验证语音对应的说话对象的识别准确度，提升用户体验程度。前述方法包括：获取终端设备发送的待验证信息，待验证信息包括待验证语音、对象标识码以及设备标识码；通过预设模型版本号所对应的神经网络模型确定待验证语音所对应的声纹特征向量；计算声纹特征向量与每个候选声纹特征向量之间的声纹相似度；从声纹特征向量与每个候选声纹特征向量之间的声纹相似度中确定目标声纹相似度；在目标声纹相似度大于或等于预设相似阈值时，向终端设备发送验证通过消息，验证通信消息包括对象标识码。
一种语音验证处理方法以及相关装置

[发明专利]语音识别方法和装置-CN202210080184.1在审
发明人：马东鹏;苏丹;唐立亮 -专利权人：腾讯科技（深圳）有限公司
申请日： 2022-01-24 - 公布日： 2022-04-26 - 主分类号： G10L15/26 文献下载
摘要：本申请公开了一种语音识别方法和装置，属于计算机技术领域。该方法包括：对目标音频数据中的每个音频帧进行特征提取，得到每个音频帧对应的特征信息；基于每个音频帧对应的特征信息和语音识别模型，确定目标音频数据对应的文本和文本中的每个文字对应的第一时间信息；基于每个音频帧对应的特征信息和主人声识别模型，确定每个音频帧对应的声音类型；基于目标音频数据对应的文本、每个文字对应的第一时间信息和每个音频帧对应的声音类型，确定目标音频数据对应的主人声文本。采用本申请，可以对目标音频数据(如音乐、视频或语音等所涉及的音频数据)中的主人声和背景人声进行区分，从而得到目标音频数据的主人声文本，提高了语音识别的准确性。
语音识别方法装置

[发明专利]语音识别方法、装置、计算机设备及存储介质-CN202111536323.9在审
发明人： 唐立亮 -专利权人：腾讯科技（深圳）有限公司
申请日： 2021-12-15 - 公布日： 2022-04-12 - 主分类号： G10L15/02 文献下载
摘要：本申请实施例公开了一种语音识别方法、装置、计算机设备及存储介质，属于计算机技术领域。该方法包括：获取语言信息，获取语音数据中的多个音频帧的语义特征，语义特征包括音频帧分别属于多个字符的第一概率；基于多个语义特征中区分度大于第一阈值的语义特征，从语言信息中提取与语音数据匹配的语义路径，将语义路径确定为语音数据的语义信息。本申请实施例提供的方法，从多个语义特征中筛选出区分度满足要求的语义特征，结合语言信息中各个字符之间的连接关系，从语言信息中提取出与该语音数据匹配的语义路径，作为识别到的语义信息，无需再对不满足区分度条件的语义特征进行处理，从而提升了语音识别效率，也保证了识别结果的准确性。
语音识别方法装置计算机设备存储介质

[发明专利]一种流式语音识别方法、装置、设备及存储介质-CN201910414688.0有效
发明人：朱绍明;唐立亮 -专利权人：腾讯科技（深圳）有限公司
申请日： 2019-05-17 - 公布日： 2021-06-22 - 主分类号： G10L15/02 文献下载
摘要：本申请公开了一种流式语音识别方法，包括：获取待识别的语音信号；对所述语音信号进行特征提取，获得语音特征；通过解码器基于声学模型和语言模型，对所述语音特征进行解码得到N个候选识别结果以及各自对应的解码得分；根据所述N个候选识别结果各自对应的置信度确定置信度阈值，所述候选识别结果对应的置信度包括声学模型得分、语言模型得分和解码得分中任一种；从所述N个候选识别结果中，筛选置信度大于所述置信度阈值的候选识别结果，生成目标候选识别结果集；根据所述目标候选识别结果集，确定所述语音信号的识别结果。如此，实现自适应输出最优实时结果，满足实时识别的业务需求，提高识别精度。本申请还公开了对应的装置、设备及介质。
一种语音识别方法装置设备存储介质

[发明专利]语音识别方法、装置、计算机设备及存储介质-CN201910740387.7有效
发明人： 唐立亮 -专利权人：腾讯科技（深圳）有限公司
申请日： 2019-07-02 - 公布日： 2020-12-11 - 主分类号： G10L15/22 文献下载
摘要：本发明公开了一种语音识别方法、装置、计算机设备及存储介质，属于人工智能技术领域。人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能软件技术包括语音技术，语音技术的关键技术有自动语音识别技术，自动语音识别技术是指自动识别人的语音以得到文字信息的过程。本发明通过仅基于第二数据包进行语音识别，减少了参与语音识别的数据包的数量，减少了运算时间。
语音识别方法装置计算机设备存储介质

[发明专利]基于人工智能的语音唤醒方法和装置-CN201611248513.X有效
发明人： 唐立亮 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2016-12-29 - 公布日： 2020-06-23 - 主分类号： G10L15/22 文献下载
摘要：本发明提出一种基于人工智能的语音唤醒方法和装置，其中，方法包括：通过对各音素进行聚类，以选取出用于指代全部音素的垃圾音素，以及根据预先设定的唤醒词，构建与所述唤醒词相似的反唤醒词之后，根据垃圾音素、反唤醒词和唤醒词构建解码网络，从而可以利用该解码网络进行语音唤醒。由于垃圾音素的数据量明显少于垃圾词的数据量，解决了现有技术中垃圾词模型占用数据量过大的问题，同时，由于词汇是由有限个音素所构成的，因此，垃圾音素相较于垃圾词也更能够较为全面覆盖全部词汇提高了唤醒精度，减少误唤醒的概率。
基于人工智能语音唤醒方法装置

[发明专利]基于人工智能的语音唤醒方法和装置-CN201611111477.2有效
发明人： 唐立亮 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2016-12-02 - 公布日： 2019-11-08 - 主分类号： G10L15/02 文献下载
摘要：本发明提出一种基于人工智能的语音唤醒方法和装置，其中，该语音唤醒方法，包括：获取自定义唤醒词对应的发音信息；获取所述发音信息对应的近似发音信息；根据预设的垃圾词列表、所述发音信息和所述近似发音信息构建唤醒词识别网络，以根据所述唤醒词识别网络对用户输入的语音进行识别，并根据识别结果确定是否执行唤醒操作。本发明的实施例，能够针对不同的自定义唤醒动态构建唤醒词识别网络，有效提升唤醒的正确率，并降低误报率，能够提升唤醒效率，内存占用更小，功耗低。
基于人工智能语音唤醒方法装置

[发明专利]语音唤醒方法及装置-CN201610039038.9有效
发明人： 唐立亮 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2016-01-20 - 公布日： 2019-10-15 - 主分类号： G10L15/22 文献下载
摘要：本申请提出一种语音唤醒方法和装置，其中，该方法包括：获取用户输入的语音；采用跳帧策略对所述语音的数据帧进行处理，并通过时域能量算法对所述数据帧进行语音活动检测；提取所述语音的声学特征，根据预设的识别网络和声学模型对所述声学特征进行语音识别；若获知所述语音为所述识别网络中预设的唤醒词，则进行相应的操作。优化了语音唤醒的处理过程，能够在保证唤醒正确率不下降的前提下，极大的减少运算量，降低设备功耗，提高处理性能。
语音唤醒方法装置

[发明专利]语音识别方法、装置、计算机设备及存储介质-CN201910589578.8在审
发明人： 唐立亮 -专利权人：腾讯科技（深圳）有限公司
申请日： 2019-07-02 - 公布日： 2019-08-20 - 主分类号： G10L15/02 文献下载
摘要：本发明公开了一种语音识别方法、装置、计算机设备及存储介质，属于人工智能技术领域。本发明通过基于每个数据包所承载语音消息的信号能量，确定第一数据包的有效指示信息，基于该有效指示信息获知该第一数据包承载有效语音消息的可能程度，在该有效指示信息满足第一目标条件时，仅基于第二数据包进行语音识别，减少了参与语音识别的数据包的数量，减少了运算时间；且基于该有效指示信息进行语音识别，避免了直接删除第一数据包导致的识别不准确的问题，因此在保证语音识别的准确率的前提下，提高了语音识别的效率。
语音识别数据包有效指示信息计算机设备存储介质人工智能技术承载目标条件信号能量有效语音语音消息准确率获知运算删除保证

[发明专利]英文人名识别方法和装置-CN201510390421.4有效
发明人： 唐立亮;彭守业 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2015-07-06 - 公布日： 2017-11-17 - 主分类号： G10L15/26 文献下载
摘要：本发明提出一种英文人名识别方法和装置，该英文人名识别方法包括接收用户输入的语音，所述语音中包括英文人名；通过加载的中文识别声学模型和已构建的识别网络对所述用户输入的语音进行识别，获取所述语音的识别结果，所述语音的识别结果中包括所述英文人名的识别结果。由于无需进行额外的模型训练和语料收集等工作，本发明实现成本低，并且由于本发明加载的是中文识别声学模型，不会对用户输入的语音中非英文部分的识别产生影响，提高了整体的识别准确率，同时对英文人名的识别准确率也高于中英文模型混合识别的准确率。
英文人名识别方法装置

[发明专利]语音识别方法及装置-CN201510427908.5有效
发明人： 唐立亮;贾磊;彭守业 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2015-07-20 - 公布日： 2017-11-03 - 主分类号： G10L15/183 文献下载
摘要：本发明公开了一种语音识别方法及装置，其中所述方法包括根据语音信息识别得到发音信息；根据所述查分树信息加载语言模型查分树，查询所述语言模型查分树确定与所述发音信息匹配的文字识别结果的概率得分；其中，所述查分树信息包括与文字对应的多个节点，每个节点至少包括当前节点与子节点之间的存储位置偏移量；根据所述概率得分选择文字识别结果，作为最终的识别结果。本发明实施例通过在启动时直接根据当前节点与子节点之间的存储位置偏移量加载语言模型查分树，这样大大的缩短了启动时间。
语音识别方法装置

[发明专利]语音唤醒方法和装置-CN201510399209.4有效
发明人： 唐立亮;贾磊;彭守业;牛建伟 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2015-07-08 - 公布日： 2017-07-25 - 主分类号： G10L15/02 文献下载
摘要：本发明公开了一种语音唤醒方法和装置，其中，语音唤醒方法包括S1、获取唤醒词，并根据唤醒词生成符合预设条件的垃圾词，以及根据唤醒词和垃圾词构建识别网络；S2、获取用户输入的语音信息，将语音信息切分为多个语音帧，并提取每个语音帧中的声学特征；S3、基于卷积神经网络声学模型对多个声学特征依次进行似然计算，以获得每个声学特征的声学特征得分；S4、根据声学特征得分从识别网络中选取最优识别路径，以及将最优识别路径对应的语音结果作为识别结果；以及S5、根据识别结果计算识别结果对应的置信度，并根据置信度获得唤醒结果并输出。本发明实施例的语音唤醒方法和装置，计算量小，功耗低，能够降低语音唤醒的误报率，提升用户使用体验。
语音唤醒方法装置

1
2
下一页»
尾页
共 17 条