“语音数据 ”专利关键词查询_检索下载_查询列表_检索列表_行业专利分布_钻瓜专利网

钻瓜专利网为您找到相关结果2593753个，建议您升级VIP下载更多相关专利

[发明专利]一种语音数据的处理方法及装置-CN201911219481.4有效
发明人：潘逸倩;方祥;陈艳妮 -专利权人：北京搜狗科技发展有限公司
申请日： 2019-11-29 - 公布日： 2022-06-03 - 主分类号： G10L15/26 文献下载
摘要：本发明公开了一种语音数据的处理方法，包括：获取第一语音数据；对所述第一语音数据进行语音识别，获得语音识别结果，所述语音识别结果中包含M个分词，M为大于或等于2的整数；基于所述语音识别结果，从所述第一语音数据中提取出第二语音数据，所述第二语音数据与所述M个分词对应；基于所述语音识别结果和所述第二语音数据进行说话人归档，获得归档结果。同时，本发明还公开了一种语音数据的处理装置和计算机可读存储介质。
一种语音数据处理方法装置

[发明专利]语音对话系统、终端装置和数据中心装置-CN201310095196.2有效
发明人：高桥润 -专利权人：富士通株式会社
申请日： 2013-03-22 - 公布日： 2013-10-23 - 主分类号： G10L13/00 文献下载
摘要：一种语音对话系统，包括数据中心装置和终端装置。数据中心装置获取对在对来自终端装置的语音数据所作的语音识别处理中获得的请求信息的回答信息，创建包括回答信息的脚本，创建关于回答信息的第一合成语音数据，将第一合成语音数据发送至终端装置，并当在创建第一合成语音数据中创建第一合成语音数据时将脚本发送至终端装置终端装置创建与接收到的脚本中的回答信息有关的第二合成语音数据，接收第一合成语音数据，基于对第一合成语音数据的接收是否完成的判断结果来选择第一合成语音数据和第二合成语音数据中的一个，并再生语音。
语音对话系统终端装置数据中心

[发明专利]可控制语音速度的语音合成方法、装置、设备及存储介质-CN202011461280.8有效
发明人：孙奥兰;王健宗;程宁 -专利权人：平安科技（深圳）有限公司
申请日： 2020-12-11 - 公布日： 2023-05-23 - 主分类号： G10L13/02 文献下载
摘要：本申请涉及人工智能技术领域，揭示了一种可控制语音速度的语音合成方法、装置、设备及存储介质，其中方法包括：根据待参考的梅尔频谱数据得到待参考的语音风格特征数据；对待合成语音的文本序列和预设语音速度进行状态向量转换得到待合成的状态向量数据；对待参考的语音风格特征数据和待合成的状态向量数据进行线性投影处理得到线性投影后的向量数据；根据待合成语音的文本序列和线性投影后的向量数据进行字符对齐处理得到字符对齐后的向量数据；对字符对齐后的向量数据进行梅尔频谱解码得到目标梅尔频谱数据；对目标梅尔频谱数据进行语音转换得到目标语音数据。实现将语音速度和语音的其他属性解耦合，改变语音速度时不会改变语音的其他属性。
控制语音速度合成方法装置设备存储介质

[发明专利]语音识别方法、装置、电子设备和存储介质-CN202011604891.3在审
发明人：万根顺;高建清;刘聪;王智国;胡国平 -专利权人：科大讯飞股份有限公司
申请日： 2020-12-30 - 公布日： 2021-04-02 - 主分类号： G10L15/07 文献下载
摘要：本发明实施例提供一种语音识别方法、装置、电子设备和存储介质，其中方法包括：确定待识别的语音数据；基于经训练的语音识别模型，确定语音数据的语音识别结果；其中，语音识别模型用于将所述语音数据的语音特征与通用发音偏差特征集进行注意力交互，或，将所述语音数据的语音特征分别与所述通用发音偏差特征集和通用说话人声纹特征集进行注意力交互，得到语音数据的说话人特征，并基于语音数据的语音特征和说话人特征，对语音数据进行语音识别。本发明实施例提供的语音识别方法、装置、电子设备和存储介质，提高了说话人自适应的实时性和效果，有助于提高多人会话场景下的语音识别准确性。
语音识别方法装置电子设备存储介质

[发明专利]一种语音模型的训练方法、装置、服务器和存储介质-CN202010826115.1在审
发明人：黎子骏 -专利权人：广州市百果园信息技术有限公司
申请日： 2020-08-17 - 公布日： 2020-11-06 - 主分类号： G10L15/06 文献下载
摘要：本发明实施例公开了一种语音模型的训练方法、装置、服务器和存储介质。其中，该方法包括：将无损语音数据和所述无损语音数据编码变换后的目标语音数据分别输入到预先构建的语音模型中，得到所述无损语音数据的第一模型结果和所述目标语音数据的第二模型结果；以使所述第一模型结果和所述第二模型结果之间的差异趋于预设差异指标为目标，对所述语音模型进行训练。本发明实施例提供的技术方案，避免语音模型对同一语音源下不同语音数据输出的模型结果之间存在的差异，减少对同一语音源下不同语音数据的模型预测波动，提高任一语音数据在语音模型下的处理准确性。
一种语音模型训练方法装置服务器存储介质

[发明专利]语音处理方法、装置、计算机可读存储介质及计算机设备-CN202111620262.4在审
发明人：孟廷;江源;宋锐 -专利权人：科大讯飞股份有限公司
申请日： 2021-12-28 - 公布日： 2022-04-01 - 主分类号： G10L13/02 文献下载
摘要：本申请实施例公开了一种语音处理方法、装置、计算机可读存储介质及计算机设备。该方法包括：根据来自终端的语音合成服务请求，确定目标性能数据以及目标发音对象的语音数据，该语音数据具有目标音色，根据目标性能数据对初始语音合成模型中的目标网络模块进行裁剪处理，以得到待训练语音合成模型，并利用语音数据对待训练语音合成模型进行训练，得到目标语音合成模型，以使得终端利用目标语音合成模型对目标文本进行语音合成处理，得到具有目标音色的合成语音数据。本申请实施例可得到与终端的性能数据匹配的目标语音合成模型，从而基于该目标语音合成模型提供符合终端的目标性能数据的语音合成服务，改善用户体验。
语音处理方法装置计算机可读存储介质设备

[发明专利]一种语音识别方法、装置、存储介质及设备-CN202310218661.0在审
发明人：吴航;陈恩红 -专利权人：科大讯飞股份有限公司
申请日： 2023-03-03 - 公布日： 2023-07-28 - 主分类号： G10L15/06 文献下载
摘要：本申请公开了一种语音识别方法、装置、存储介质及设备，该方法包括：首先获取待识别的目标语音数据，然后将目标语音数据输入至预先构建的语音识别模型，预测得到目标语音数据的语音识别结果，其中，语音识别模型是在利用无监督语音数据及其说话人相关信息进行预训练后，再利用有监督语音数据进行微调得到的。可见，由于本申请是通过先利用无监督语音数据及其说话人相关信息进行预训练后，再利用有监督语音数据进行微调构建了语音识别模型，有效提升了模型对不同说话人进行语音识别的鲁棒性，从而在利用该语音识别模型对目标语音数据进行识别时
一种语音识别方法装置存储介质设备

[发明专利]一种基于TD平台的软内核实现语音播报的方法-CN201010117543.3无效
发明人：刘敬毅;郑添来 -专利权人：厦门敏讯信息技术股份有限公司
申请日： 2010-03-03 - 公布日： 2011-09-21 - 主分类号： G10L13/02 文献下载
摘要：本发明公开了一种基于TD平台的软内核实现语音播报的方法，它包括：步骤10，传入要播报的原始语音数据；步骤20，发送语音合成信号，启动语音合成线程，开始语音数据合成；步骤30，将合成的语音数据插入播放队列中；步骤31，合成语音数据；步骤32，当合成的语音数据量达到一定缓存上限时，发送阻塞信号，激活阻塞线程；步骤40，启动TD平台的语音播放软内核，开始播放语音；步骤41，判断播放队列中的语音数据剩余量，当播放队列的语音数据剩余量达到一定缓存下限时，执行步骤42，否则继续执行步骤40；步骤42，发送停止阻塞信号，停止阻塞线程，启动语音合成线程，继续进行语音数据合成，转跳执行步骤20；步骤50，结束语音播放。
一种基于 td 平台内核实现语音播报方法

[发明专利]语音交互方法、装置、电子设备及介质-CN202210952253.3在审
发明人：曾焕数 -专利权人：斑马网络技术有限公司
申请日： 2022-08-09 - 公布日： 2022-12-13 - 主分类号： G10L15/22 文献下载
摘要：本发明公开了一种语音交互方法，在目标应用运行之后，获取用户语音数据；对所述用户语音数据进行语音特征数据提取，得到用户语音特征数据；根据所述用户语音特征数据，从预先配置的语音指令映射表中查找与所述用户语音特征数据对应的目标操作指令，所述语音指令映射表中存储语音特征数据与操作指令的映射关系；根据所述目标操作指令，控制所述目标应用执行与所述目标操作指令对应的目标操作。本发明公开的语音交互方法、装置、电子设备及介质，能够有效提高语音数据触发应用功能的准确性，使得用户的体验更好。
语音交互方法装置电子设备介质

[发明专利]语音数据生成方法及相关装置-CN201810816978.3有效
发明人：郑志勇;柳明 -专利权人： OPPO（重庆）智能科技有限公司
申请日： 2018-07-24 - 公布日： 2021-04-16 - 主分类号： G10L13/04 文献下载
摘要：本申请公开了一种语音数据生成方法及相关装置，应用于电子设备，所述电子设备包括麦克风，包括：电子设备通过握持姿态确定麦克风被堵塞；当检测到目标语音数据的获取指令时，通过麦克风获取第一语音数据，第一语音数据为目标语音数据的部分语音数据；将第一语音数据输入第一预设模型生成目标语音数据，第一预设模型用于预测第一语音数据的数据缺失片段。本申请有利于提高电子设备在进行语音数据生成过程中智能性和准确性。
语音数据生成方法相关装置

[发明专利]一种语音标注方法、装置、设备及介质-CN202211513758.6在审
发明人：鲜英;杜新凯;陆昕;刘凯;冉玥;耿春云;宁荣荣;唐延欢 -专利权人：阳光保险集团股份有限公司
申请日： 2022-11-29 - 公布日： 2023-03-28 - 主分类号： G10L15/06 文献下载
摘要：本申请公开了一种语音标注方法、设备及介质，应用于语音识别技术领域，用以解决现有技术中存在的语音数据的传统人工标注方法的效率低、质量较差的问题。具体为：获取待识别的语音数据；将待识别的语音数据中满足语音质量要求的语音数据作为目标语音数据输入语音识别模型得到文本数据；按照语音标注规则对文本数据中不满足无效判定条件的数据进行标注得到初始标注数据；确定初始标注数据符合标注质量要求时，将初始标注数据确定为目标标注数据。这样，利用语音识别模型减少对人工的依赖，通过语音质量要求和无效判定条件的筛选可以较少对无效数据的处理，提高标注效率，标注人员仅基于标注质量要求核验初始标注数据也可以提高标注效率和标注质量。
一种语音标注方法装置设备介质

[发明专利]一种数据处理方法、电子设备及存储介质-CN202310174686.5有效
发明人：孟君;贺琳;崔向雨;邵志明;黄宇凯;郝玉峰;李科 -专利权人：北京海天瑞声科技股份有限公司
申请日： 2023-02-28 - 公布日： 2023-06-30 - 主分类号： G10L17/02 文献下载
摘要：本公开是关于一种数据处理方法、电子设备及存储介质。数据处理方法包括：获取第一语音数据和多个第二语音数据；其中，所述第一语音数据和所述第二语音数据由多个录音角色在同一对话场景、同一时段内录制得到，所述第一语音数据包含全部所述录音角色录制的对话内容，所述多个第二语音数据中各个第二语音数据分别包含单一所述录音角色录制的对话内容，且所述多个第二语音数据与所述多个录音角色一一对应；基于所述第一语音数据和所述多个第二语音数据，生成用于训练语音识别模型的对话样本数据。通过本公开可以实现多人对话语音样本数据的自动标注及生成。
一种数据处理方法电子设备存储介质

[发明专利]一种基于语音识别的数据挖掘方法和系统-CN201010295597.9有效
发明人：刘致远 -专利权人：深圳市腾讯计算机系统有限公司
申请日： 2010-09-27 - 公布日： 2012-04-18 - 主分类号： G10L15/08 文献下载
摘要：本发明公开了一种语音识别的数据挖掘方法和系统，方法包括：从语音文件数据库中提取语音文件，并通过语音识别操作对提取的语音文件进行语义分析，将该语音文件转换为文本数据；对转换的文本数据进行数据挖掘，得到最终的可用数据通过本发明的方法和系统，实现了对语音信息的数据挖掘，并提高了语音渠道的客服数据统计的准确性。
一种基于语音识别数据挖掘方法系统

[发明专利]模型训练方法、语音识别方法、装置、服务器及存储介质-CN202110484676.2有效
发明人：王璐;魏韬;马骏;王少军 -专利权人：平安科技（深圳）有限公司
申请日： 2021-04-30 - 公布日： 2023-01-03 - 主分类号： G10L15/06 文献下载
摘要：本申请涉及人工智能中的模型构建，提供一种模型训练方法、语音识别方法、装置、服务器及存储介质，该方法包括：对语音数据进行第一信号处理得到第一语音数据，对语音数据进行第二信号处理得到第二语音数据；将第一语音数据和第二语音数据输入特征提取模型，以提取第一语音数据的第一特征向量，以及第二语音数据的第二特征向量；根据第一特征向量和第二特征向量，计算第一语音数据与第二语音数据之间的互信息；根据第一语音数据与第二语音数据之间的互信息，更新特征提取模型的模型参数，直至特征提取模型收敛；将收敛后的特征提取模型和训练好的语音识别模型进行融合并微调，以获取目标语音识别模型。本申请可提高语音识别模型的鲁棒性。
模型训练方法语音识别装置服务器存储介质

[发明专利]适用于多种用户的语音识别方法、装置、设备及介质-CN202011247745.X在审
发明人：姚宏志 -专利权人：平安普惠企业管理有限公司
申请日： 2020-11-10 - 公布日： 2021-02-09 - 主分类号： G10L15/00 文献下载
摘要：本申请涉及人工智能技术领域，揭示了一种适用于多种用户的语音识别方法、装置、设备及介质，其中方法包括：获取语音识别模式确定请求；响应获取语音识别模式确定请求，播放预设提问语音，根据播放的预设提问语音获取用户输入的回答语音数据；根据回答语音数据，确定语音特征数据和待识别用户信息；根据语音特征数据和待识别用户信息，确定目标语音识别模式；获取待识别语音数据；采用目标语音识别模式对待识别语音数据进行语音识别，得到待识别语音数据对应的目标文本数据从而实现针对不同特征的用户提供针对性的语音识别模式，确保了语音识别的准确率的一致性，提高了用户体验，从而有利于应用于具有多种用户类别的应用场景。
适用于多种用户语音识别方法装置设备介质