“目标发音”专利关键词查询_检索下载_查询列表_检索列表_行业专利分布_钻瓜专利网

钻瓜专利网为您找到相关结果885745个，建议您升级VIP下载更多相关专利

[发明专利]动画生成方法、装置、电子设备和存储介质-CN202110812403.6在审
发明人：王海新;杜峰 -专利权人：北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司
申请日： 2021-07-19 - 公布日： 2021-10-22 - 主分类号： G10L15/00 文献下载
摘要：本发明实施例公开了一种动画生成方法、装置、电子设备和存储介质，该动画生成方法包括：获取目标语音数据和目标语音数据对应的目标文本数据，目标语音数据中包括不同语种的语音数据；对目标文本数据进行分析识别，得到目标文本数据中包括的各个音素，并对目标语音数据进行分析识别，得到各个音素中的每个音素的发音时段；确定每个音素所属的语种；查询每个音素所属的语种的口型配置表，得到为每个音素配置的口型；在每个音素的发音时段内按照对应的口型驱动虚拟形象
动画生成方法装置电子设备存储介质

[发明专利]语音动画的合成方法、装置、电子设备及存储介质-CN202110671977.6在审
发明人：曹爽;潘伟洲;曾润良 -专利权人：腾讯科技（深圳）有限公司
申请日： 2021-06-17 - 公布日： 2022-12-20 - 主分类号： G10L13/02 文献下载
摘要：该方法包括：显示图像采集控件，响应于图像采集控件的触发操作，采集目标用户的面部图像，获得目标面部图像；显示跟读信息和跟读控件，响应于跟读控件的触发操作，采集目标用户输入的、与跟读信息对应的音频信息；获取并显示包括目标用户唇形变化的图像的语音动画，目标用户的唇形变化与音频信息的内容同步，目标用户唇形变化的图像是根据目标面部图像中的唇形和音频信息得到的。本申请实施例能够帮助用户根据语音动画更准确地练习发音以及发音时的唇形，提高语言学习的兴趣和效率。
语音动画合成方法装置电子设备存储介质

[发明专利]一种进线请求处理方法、装置及电子设备-CN202110643784.X有效
发明人：程尧 -专利权人：中国银行股份有限公司
申请日： 2021-06-09 - 公布日： 2023-01-20 - 主分类号： H04M3/493 文献下载
摘要：本发明提供了一种进线请求处理方法、装置及电子设备，在检测到进线请求的情况下，获取生成进线请求的目标用户的身份信息，并确定与所述身份信息对应的发音标准程度值，在确定出所述发音标准程度值小于第一预设阈值的情况下，说明用户发音标准程度较差，此时调用IVR按键导航功能处理所述进线请求，用户仅需按键即可确定业务，不需要语音交互，进而能够避免由于发音不标准而带来的无法确定要处理的业务，使得业务办理效率低的问题，保证了用户能够正常办理业务
一种请求处理方法装置电子设备

[发明专利]一种语音处理方法、装置和电子设备-CN202010301719.4在审
发明人：李栋梁;刘恺;周明;陈伟 -专利权人：北京搜狗科技发展有限公司
申请日： 2020-04-16 - 公布日： 2021-10-22 - 主分类号： G10L13/08 文献下载
摘要：本发明实施例提供了一种语音处理方法、装置和电子设备，其中，所述方法包括：获取待转换的文本信息，以及确定所述文本信息对应的源语种和待转换的目标用户；依据所述文本信息和所述目标用户对应的目标转换模型，将所述文本信息转换为目标用户采用源语种发音的目标语音数据；其中，所述目标转换模型依据目标用户发音的单语种语音数据对训练后的通用转换模型进行自适应训练，所述通用转换模型依据包含N种语种的语音数据进行训练；所述源语种为所述N种语种中的一种，N为大于1的整数；进而能够在只有目标用户单一语种的语音数据情况下，将多语种的文本转为对应语种的目标用户的目标语音数据，实现多语种的语音转换。
一种语音处理方法装置电子设备

[发明专利]文本纠错处理方法、装置、电子设备及可读存储介质-CN202310105534.X在审
发明人：胡勇 -专利权人：腾讯科技（深圳）有限公司
申请日： 2023-01-20 - 公布日： 2023-10-27 - 主分类号： G06F40/30 文献下载
摘要：本申请提供了一种文本纠错处理方法、装置、电子设备及可读存储介质；方法包括：获取目标文本；确定所述目标文本中每个目标字符的语义特征向量，并确定所述每个目标字符的发音特征向量；对所述每个目标字符的语义特征向量和发音特征向量进行融合处理，得到所述每个目标字符的字符特征向量；基于所述每个目标字符的字符特征向量进行编码处理，得到所述每个目标字符的上下文特征向量；将所述每个目标字符的上下文特征向量映射为字表中每个候选字符的概率，将最大概率的候选字符作为纠错字符，基于所述每个目标字符对应的纠错字符组合形成纠错文本。
文本纠错处理方法装置电子设备可读存储介质

[发明专利]中英文混合识别方法、装置和计算机设备-CN202210477795.X在审
发明人：王伟戌;王强强;商迎新;付涛;李超凡 -专利权人：北京云思智学科技有限公司
申请日： 2022-04-28 - 公布日： 2022-09-27 - 主分类号： G10L15/00 文献下载
摘要：本发明提供一种中英文混合识别方法，包括：获取待识别的语音信号，所述待识别的语音信号中包含中文字符和/或英文字符，通过中英文识别模型处理所述语音信号，获取所述语音信号对应的发音序列，所述发音序列中包含中文字符的发音特征和/或英文字符的发音特征，基于所述中文字符的发音特征和/或英文字符的发音特征，从发音字典匹配至少一个候选文本，通过语言模型处理所述至少一个候选文本，获取所述至少一个候选文本的概率，根据所述至少一个候选文本的概率，确定所述语音信号对应的目标文本，以此方式实现通过中英文识别模型可以识别混合语种的语音信号，并基于语音模型可以从候选文本中快速准确的确定出与该语音信号匹配较高的文本数据。
中英文混合识别方法装置计算机设备

[发明专利]虚拟形象唇形驱动方法、装置、介质及电子设备-CN202310108970.2在审
发明人：毕成;马泽君 -专利权人：北京有竹居网络技术有限公司
申请日： 2023-01-31 - 公布日： 2023-05-16 - 主分类号： G06T13/40 文献下载
摘要：方法包括：确定目标文本对应的目标IPA序列和该序列中各音标的发音时长；根据每一发音时长，对目标IPA序列进行时长扩展，得到扩展序列；针对扩展序列中的每一音标，从扩展序列中提取包含该音标的N‑gram音标串，得到目标音标序列；根据参考音标序列与唇形参数的对应关系，确定与目标音标序列相匹配的唇形参数；基于该音标对应的唇形参数，对目标虚拟形象进行唇形渲染。在获取扩展序列中的每一目标音标对应的唇形参数时，同时考虑目标音标本身和其上下文信息，可使得不同IPA组合下的唇形参数更符合真实面部情况，使得目标虚拟形象的唇形尽可能逼真，提升动画效果。
虚拟形象驱动方法装置介质电子设备

[发明专利]一种词汇拆分模型构建方法、语音识别模型构建方法-CN202210493382.0在审
发明人：蔡沅沅;张光云;万根顺;高建清;刘聪;胡国平;刘庆峰 -专利权人：科大讯飞股份有限公司
申请日： 2022-05-07 - 公布日： 2022-08-30 - 主分类号： G10L15/06 文献下载
摘要：本申请公开了一种词汇拆分模型构建方法、语音识别模型构建方法，本申请先利用大量样本词汇、这些样本词汇的发音描述信息、以及这些样本词汇的拆分标注信息，构建词汇拆分模型，以使构建好的词汇拆分模型能够学习到依据词汇发音进行词汇拆分处理的能力；再利用构建好的词汇拆分模型、以及该目标语种下大量的最小语义单元，构建该目标语种下的子词词典；然后，借助该子词词典，构建该目标语种下的语音识别模型；最后，利用该语音识别模型针对该目标语种下的任意一个语音数据进行语音识别处理，如此有利于提高该目标语种下的语音识别效果。
一种词汇拆分模型构建方法语音识别

[发明专利]英文语音合成方法及装置-CN202010141017.4有效
发明人：孙见青 -专利权人：云知声智能科技股份有限公司;厦门云知芯智能科技有限公司
申请日： 2020-03-03 - 公布日： 2022-06-24 - 主分类号： G10L13/02 文献下载
摘要：该方法包括：获取发音标准的英文音库；根据所述发音标准的英文音库，构建预设英文合成模型；获取非专业人员录制的目标英文音库；根据所述目标英文音库，对所述预设英文合成模型进行调整，获得目标英文合成模型；利用所述目标英文合成模型通过本发明的技术方案，可获得合成自然度较高的目标英文合成模型，从而便于之后能够获得自然度较高(即语速正常、语调正常、音色一致)的英文语音，甚至在中英文混合的场景下也能准确进行英文语音合成，确保中文和英文合成音色的一致性
英文语音合成方法装置

[发明专利]一种语音合成方法及装置-CN202010872280.0在审
发明人：洪林;苏少炜;常乐 -专利权人：北京声智科技有限公司
申请日： 2020-08-26 - 公布日： 2020-11-24 - 主分类号： G10L13/02 文献下载
摘要：本发明提供一种语音合成方法及装置，该方法包括：获取待处理文本，以及获取目标语音合成参数，其中，所述目标语音合成参数包括发音对象和发音参数中的至少一项；对所述待处理文本进行拆分，得到至少两段文本；通过与所述目标语音合成参数对应的语音合成模型本发明实施例通过获取待处理文本和目标语音合成参数，并对待处理文本进行拆分，以及通过与目标语音合成参数对应的语音合成模型，对拆分的多段文本进行语音合成，从而不仅能够合成具备目标语音合成参数的合成语音，还能保证语音合成的实效性
一种语音合成方法装置

[发明专利]一种错误反馈方法、装置、设备及可读存储介质-CN202010663079.1在审
发明人：王永杰 -专利权人：上海流利说信息技术有限公司
申请日： 2020-07-10 - 公布日： 2022-01-11 - 主分类号： G09B7/02 文献下载
摘要：本发明公开了一种错误反馈方法、装置、设备及计算机可读存储介质，该方法包括：获取与题目对应的音频数据；在音频数据中确定与题目中的目标知识点对应的目标音频数据；判断目标音频数据是否正确；若目标音频数据不正确，则确定目标音频数据的错误类型，根据错误类型反馈纠正信息；该方法使纠正信息与错误类型相匹配，而错误类型为目标音频数据的错误类型，音频数据与用户发出的声音相对应，因此反馈的纠正信息可以对用户的具体错误情况进行纠正，使用户了解与正确发音之间的差异在哪儿，如何纠正差异，进而有效地提升用户的发音能力，纠正效果较好。
一种错误反馈方法装置设备可读存储介质

[发明专利]发音对象识别、会议中的说话人识别方法以及装置-CN202211675795.7在审
发明人：陈亚峰;郑斯奇;王绘;程路遥 -专利权人：阿里巴巴达摩院（杭州）科技有限公司
申请日： 2022-12-26 - 公布日： 2023-05-30 - 主分类号： G10L17/04 文献下载
摘要：本说明书实施例提供发音对象识别、会议中的说话人识别方法以及装置，其中发音识别方法包括：获取待识别的语音数据；将语音数据输入预先训练的声纹识别模型，确定语音数据对应的目标发音对象，该声纹识别模型为利用无标签语音样本对指定模型进行自监督训练得到，自监督训练中采用的损失包括第一损失和第二损失，第一损失基于同一批次的多个无标签语音样本分别对应的发音对象的特征差异确定，第二损失基于无标签语音样本对应的发音对象的对象特征确定。如此，使用无标签语音样本对模型进行自监督训练，降低了数据成本和人力成本，提高了模型训练的效率，并且能够确保同一批次的不同发音对象的对象特征的多样性，降低了模型坍塌问题出现的可能性。
发音对象识别会议中的说话方法以及装置

[发明专利]视频编辑器、视频编辑方法及相关装置-CN202310564949.3在审
发明人：黄晨升;戴鹭琳;张晨露;柴金祥 -专利权人：魔珐（上海）信息科技有限公司;上海墨舞科技有限公司
申请日： 2023-05-18 - 公布日： 2023-10-03 - 主分类号： H04N21/81 文献下载
摘要：本申请提供了视频编辑器、视频编辑方法及相关装置，用于制作虚拟对象互动应用的虚拟对象的目标视频，所述视频编辑器包括：视频预设模块，所述视频预设模块用于配置所述目标视频的配置信息，所述配置信息包括视频名称信息、视频尺寸信息、虚拟对象信息、姿势信息、发音语言信息和发音音色信息中的一种或多种；视频编辑模块，所述视频编辑模块用于配置所述目标视频的配置素材；视频合成模块，所述视频合成模块用于预览、合成和下载所述目标视频
视频编辑器编辑方法相关装置

[发明专利]一种口型动画的生成方法、装置、电子设备及存储介质-CN202211053343.5在审
发明人：程平;吴松城 -专利权人：厦门黑镜科技有限公司
申请日： 2022-08-31 - 公布日： 2022-12-02 - 主分类号： G06T13/20 文献下载
摘要：方法包括：获取用于生成口型动画的目标语音数据；解析目标语音数据，得到目标语音数据所对应的音素序列；获取音素序列中每个音素单元对应的目标持续时间，以及获取音素单元对应的目标动画单元；基于音素序列中每个音素单元对应的目标持续时间以及目标动画单元，生成目标语音数据对应的口型动画。本申请通过检测语音数据中的音素单元，并确定每个音素单元在语音数据中的持续时间以及音素单元对应的动画单元，最终利用音素单元的持续时间以及动画单元生成口型动画，以此将口型动画的发音动作与文本中文字的发音顺序准确的贴合
一种口型动画生成方法装置电子设备存储介质

[发明专利]针对年轻学习者的基于计算机的语言浸入式教学-CN201210276529.7有效
发明人： D·多林;D·亨徳里;S·约斯特;J·C·陈 -专利权人：学习时代公司
申请日： 2012-08-02 - 公布日： 2013-06-05 - 主分类号： G09B5/06 文献下载
摘要：计算机执行的系统和计算机可读的介质，其包含：使得一个数字处理设备可提供目标语言中配音音频的手段；使得该数字处理设备可提供录制使用者的发音并将其与一个或多个示范发音进行比对的手段；和可提供与该目标语言有关的数项活动的手段
针对年轻学习者基于计算机语言浸入教学