“吴松城”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果36个，建议您升级VIP下载更多相关专利

[发明专利]一种数字人的控制方法、装置、电子设备和存储介质-CN202310572396.6在审
发明人：张培养;吴松城 -专利权人：厦门黑镜科技有限公司
申请日： 2023-05-19 - 公布日： 2023-10-20 - 主分类号： G06F16/332 文献下载
摘要：本发明公开了一种数字人的控制方法、装置、电子设备和存储介质，该方法包括：获取待播报的目标文本，按预设句子拆分规则将目标文本转换为至少一个子句，将子句输入预设情绪分类模型，确定与子句对应的情绪标签，根据情绪标签从预设动画库中确定目标肢体动画和目标表情动画，将子句、情绪标签以及与子句对应的目标音色输入预设语音口型生成模型，得到目标音频和口型动画。若子句为多个，按各子句的先后顺序控制预设数字人执行目标音频、口型动画、目标肢体动画和目标表情动画，以使预设数字人表演播报目标文本，以此实现使数字人按与文本对应的情绪对文本进行播报，从而提高了数字人的交互效率，并提升了用户体验。
一种数字控制方法装置电子设备存储介质

[发明专利]一种基于发音人向量的语音合成方法和装置-CN202310735509.X在审
发明人：涂清华;吴松城 -专利权人：厦门黑镜科技有限公司
申请日： 2023-06-20 - 公布日： 2023-10-13 - 主分类号： G10L13/08 文献下载
摘要：本发明公开了一种基于发音人向量的语音合成方法和装置，该方法包括：根据预设文本分析算法对待处理文本进行分析，得到前端文本特征，基于预设声学模型对前端文本特征进行编码，得到与语种信息和发音人信息解耦的编码特征，基于预设声纹模型从目标发音人的音频中提取发音人向量。基于预设声学模型对编码特征、发音人向量和目标语种信息进行解码，得到依次生成的多个频谱帧，将各频谱帧依次输入预设声码器，生成目标音频，以此利用从预设声纹模型提取的发音人向量，实现对预设声学模型的微调，从而提高了语音合成的效率。
一种基于发音向量语音合成方法装置

[发明专利]数字人的交互控制方法、装置、电子设备和存储介质-CN202310651989.1在审
发明人：黄伟坤;吴松城 -专利权人：厦门黑镜科技有限公司
申请日： 2023-06-02 - 公布日： 2023-10-03 - 主分类号： G06F3/01 文献下载
摘要：本发明公开了一种数字人的交互控制方法、装置、电子设备和存储介质，该方法包括：获取用户的交互请求，根据交互请求生成答复音频，根据答复音频确定显示屏中数字人的表情动作参数，根据用户与显示屏的相对位置确定数字人的面部朝向参数，其中，面部朝向参数用于使数字人的面部朝向用户。基于表情动作参数和面部朝向参数驱动数字人，得到视频帧序列，将答复音频和视频帧序列合并，得到数字人的交互视频，并在显示屏中播放交互视频，以此模拟出用户与数字人面对面交流的交互效果，进一步提高了数字人的交互效率，提升了用户体验。
数字交互控制方法装置电子设备存储介质

[发明专利]跨语种的语音合成方法、装置、电子设备和存储介质-CN202310735506.6在审
发明人：涂清华;吴松城 -专利权人：厦门黑镜科技有限公司
申请日： 2023-06-20 - 公布日： 2023-09-29 - 主分类号： G10L13/08 文献下载
摘要：本发明公开了一种跨语种的语音合成方法、装置、电子设备和存储介质，该方法包括：根据预设文本分析算法对待处理文本进行分析，得到前端文本特征，基于预设声学模型对前端文本特征进行编码，得到与语种信息和发音人信息解耦的编码特征。基于预设声学模型对编码特征、预设发音人向量和预设语种信息进行解码，得到依次生成的多个频谱帧，将各频谱帧依次输入预设声码器，生成目标音频，以此在编码时对语种信息和发音人信息解耦，并在解码时加入预设发音人向量和预设语种信息，无需提供多语种数据进行模型训练，从而高效的实现了跨语种的语音合成。
语种语音合成方法装置电子设备存储介质

[发明专利]数字人的互动控制方法、装置、电子设备和存储介质-CN202310571788.0在审
发明人：张培养;吴松城 -专利权人：厦门黑镜科技有限公司
申请日： 2023-05-19 - 公布日： 2023-09-29 - 主分类号： G06F9/4401 文献下载
摘要：本发明公开了一种数字人的互动控制方法、装置、电子设备和存储介质，该方法包括：获取用户发出的数字人激活操作，数字人激活操作包括语音唤醒操作或屏幕解锁操作，若数字人激活操作为语音唤醒操作，加载预设数字人，并根据语音唤醒操作中的语音信息使预设数字人执行响应动画。若数字人激活操作为屏幕解锁操作，读取至少一个预设触发信息，若预设触发信息满足预设场景触发条件，加载预设数字人，并使预设数字人执行与预设触发信息对应的场景触发动作，以此通过数字人激活操作唤醒数字人进行互动，从而提高了数字人的交互效率，提升了用户体验。
数字互动控制方法装置电子设备存储介质

[发明专利]基于数字人的人机交互方法、装置、电子设备和存储介质-CN202310650886.3在审
发明人：黄伟坤;吴松城 -专利权人：厦门黑镜科技有限公司
申请日： 2023-06-02 - 公布日： 2023-09-19 - 主分类号： G06F16/332 文献下载
摘要：本发明公开了一种基于数字人的人机交互方法、装置、电子设备和存储介质，该方法包括：根据用户的语音交互请求生成答复音频，并基于预设语音识别模型将答复音频转换为目标文本，根据答复音频和目标文本确定显示屏中数字人的表情动作参数，根据用户与显示屏的相对位置确定数字人的目标视线方向，其中，目标视线方向用于使数字人的视线朝向用户。基于表情动作参数和目标视线方向驱动数字人，得到视频帧序列，将答复音频和视频帧序列合并，得到数字人的交互视频，并在显示屏中播放交互视频，以此使数字人的视线朝向用户进行交互，模拟出用户与数字人面对面交流的交互效果，从而进一步提高了数字人的交互效率，提升了用户体验。
基于数字人机交互方法装置电子设备存储介质

[发明专利]数字人视频的生成方法、装置、电子设备和存储介质-CN202310291808.9在审
发明人：程平;吴松城 -专利权人：厦门黑镜科技有限公司
申请日： 2023-03-23 - 公布日： 2023-08-01 - 主分类号： H04N21/81 文献下载
摘要：本发明公开了一种数字人视频的生成方法、装置、电子设备和存储介质，该方法包括：获取待讲解的演示文档，根据所述演示文档的文档内容生成第一视频，并根据所述文档内容中的文本数据生成目标音频；根据所述文本数据和所述目标音频生成与所述目标音频同步的唇形图像序列；根据预设数字人形象和所述唇形图像序列生成第二视频，所述第二视频中包括与所述预设数字人形象对应的数字人；根据所述第一视频和所述第二视频生成所述数字人讲解所述演示文档的目标视频，实现在演示文档内容的同时，通过数字人对演示文档进行同步讲解，从而更加高效的对演示文档进行讲解，提升了用户体验。
数字视频生成方法装置电子设备存储介质

[发明专利]数字人视频的生成方法、装置、电子设备和存储介质-CN202310446324.7在审
发明人：程平;吴松城 -专利权人：厦门黑镜科技有限公司
申请日： 2023-04-24 - 公布日： 2023-08-01 - 主分类号： H04N21/81 文献下载
摘要：本发明公开了一种数字人视频的生成方法、装置、电子设备和存储介质，该方法包括：获取待播报的目标文本，根据所述目标文本生成目标音频；根据所述目标音频生成唇部动作参数；从真实人脸播报所述目标文本的视频中获取真实人脸图像，根据所述真实人脸图像的形象描述参数生成目标数字人的形象图像；根据所述目标音频、所述唇部动作参数和所述形象图像生成所述目标数字人播报所述目标文本的数字人视频，无需花费大量时间训练数字人生成模型，只需根据待播报的文本和真实人脸的播报该文本的视频即可快速生成相应的数字人播报视频，从而提高了数字人视频的生成效率。
数字视频生成方法装置电子设备存储介质

[发明专利]数字人的互动控制方法、装置、电子设备和存储介质-CN202310155622.0在审
发明人： 吴松城;陈军宏 -专利权人：厦门黑镜科技有限公司
申请日： 2023-02-23 - 公布日： 2023-07-11 - 主分类号： G06F16/332 文献下载
摘要：本发明公开了一种数字人的互动控制方法、装置、电子设备和存储介质，该方法包括：获取用户发送的提问请求，根据所述提问请求的语义判断预设问题集合中是否存在与所述语义匹配的目标问题；若存在所述目标问题，根据与所述目标问题对应的预设驱动参数确定目标驱动参数；若不存在所述目标问题，基于预设语言处理模型生成与所述提问请求对应的应答文本，并根据所述应答文本生成所述目标驱动参数；基于所述目标驱动参数驱动预设数字人，以使所述预设数字人展示与所述提问请求对应的应答动画，通过预设数字人展示相应的应答动画，实现更加高效的进行人机交互，提升了用户体验。
数字互动控制方法装置电子设备存储介质

[发明专利]数字人视频的生成方法、装置、电子设备和存储介质-CN202310132741.4在审
发明人：程平;吴松城 -专利权人：厦门黑镜科技有限公司
申请日： 2023-02-17 - 公布日： 2023-07-04 - 主分类号： G06T17/00 文献下载
摘要：本发明公开了一种数字人视频的生成方法、装置、电子设备和存储介质，该方法包括：根据目标音频的时长从目标人的真实说话视频中获取多个源视频帧；对各源视频帧进行3D人脸建模，并将得到的多个第一3D人脸模型的表情参数置零，得到多个第二3D人脸模型；按各音素的时序对各第二3D人脸模型和基于各音素生成的各第三3D人脸模型进行融合，并渲染出人脸图像序列；按时序将人脸图像序列和各源视频帧进行融合，并将融合图像中的预设区域置为黑色，得到多个渲染帧；将各渲染帧输入图像转换模型，并将目标音频和图像转换模型输出的目标视频帧序列进行合成处理，得到数字人视频，从而提高了数字人视频和真实说话视频之间人脸的一致性。
数字视频生成方法装置电子设备存储介质

[发明专利]数字人动画的生成方法、装置、电子设备和存储介质-CN202310241422.7在审
发明人：程平;吴松城 -专利权人：厦门黑镜科技有限公司
申请日： 2023-03-14 - 公布日： 2023-06-30 - 主分类号： G06T13/00 文献下载
摘要：本发明公开了一种数字人动画的生成方法、装置、电子设备和存储介质，该方法包括：获取第一数字人在指定表情动画下的控制参数，控制参数由多个不同面部区域的第一参数组成；将控制参数输入表情参数预测模型，根据表情参数预测模型的输出得到预测控制参数，预测控制参数由多个与第一参数对应的第二参数组成；基于与各面部区域对应的多个预设权重数据对各第二参数进行加权，得到与预测控制参数对应的目标控制参数；基于目标控制参数驱动第二数字人，得到目标表情动画，目标表情动画中第二数字人按指定表情动画中的表情序列进行表情展示，实现了用一个数字人的表情控制参数驱动另一个数字人的表情，提高了数字人面部表情动画的生成效率。
数字动画生成方法装置电子设备存储介质

[发明专利]数字人动画的生成方法、装置、电子设备及存储介质-CN202211446978.1在审
发明人：沈晓彬;吴松城 -专利权人：厦门黑镜科技有限公司
申请日： 2022-11-18 - 公布日： 2023-06-13 - 主分类号： G06T13/40 文献下载
摘要：本发明公开了一种数字人动画的生成方法、装置、电子设备及存储介质，该方法包括：获取待编辑数字人，接收用户对待编辑数字人的编辑请求并建立与WebRTC服务器的WebRTC链接，编辑请求中包括编辑参数；基于WebRTC链接将编辑参数和待编辑数字人发送至WebRTC服务器，以使WebRTC服务器将编辑参数和待编辑数字人转发至实时渲染服务节点；根据WebRTC服务器返回的视频流获取目标数字人动画，并在前端展示目标数字人动画，视频流是实时渲染服务节点按编辑参数对待编辑数字人进行渲染后生成的，将待编辑数字人在实时渲染服务节点进行处理并生成数字人动画，从而降低了服务器的处理压力，并提高了数字人动画的生成效率和实时性。
数字动画生成方法装置电子设备存储介质

[发明专利]一种语音合成方法、装置、电子设备及存储介质-CN202211614246.9在审
发明人：涂清华;吴松城 -专利权人：厦门黑镜科技有限公司
申请日： 2022-12-15 - 公布日： 2023-05-05 - 主分类号： G10L19/16 文献下载
摘要：本发明公开了一种语音合成方法、装置、电子设备及存储介质，该方法包括：获取与待处理文本对应的前端文本特征；基于预设声学模型对前端文本特征进行编码，得到编码特征；基于预设声学模型对编码特征进行解码运算，得到依次生成的多个频谱帧；将各频谱帧依次输入预设声码器，生成与待处理文本对应的音频；预设声学模型采用预设自回归循环神经网络进行解码运算，预设自回归循环神经网络在各时刻的输出包括当前时刻的频谱帧和当前时刻的隐藏层参数信息，预设自回归循环神经网络在各时刻的输入包括上一时刻的频谱帧和上一时刻的隐藏层参数信息，实现流式输出各频谱帧，从而提高了语音合成时的响应速度。
一种语音合成方法装置电子设备存储介质

[发明专利]一种字幕生成方法、装置、电子设备和存储介质-CN202211590893.0在审
发明人：程平;吴松城 -专利权人：厦门黑镜科技有限公司
申请日： 2022-12-12 - 公布日： 2023-03-28 - 主分类号： G10L15/26 文献下载
摘要：本发明公开了一种字幕生成方法、装置、电子设备和存储介质，该方法包括：获取待识别语音和第一文本，基于预设语音识别算法对待识别语音进行语音识别，得到至少一个文本语句，待识别语音是基于第一文本生成的；若第一文本中带有标点符号，基于标点符号将第一文本划分为多个语句单元；基于预设分词算法对各语句单元进行分词处理，得到多个分词；将文本语句分别与各分词进行匹配，根据匹配结果确定各语句单元中与文本语句对应的目标语句单元；基于目标语句单元校正文本语句并得到目标文本语句，根据各目标文本语句生成目标字幕，基于先验的文本信息校正语音识别出的文本语句，实现了更加准确的进行字幕生成，提升了用户体验。
一种字幕生成方法装置电子设备存储介质

[发明专利]数字人动画的生成方法、装置、电子设备和存储介质-CN202211385266.3在审
发明人：程平;吴松城 -专利权人：厦门黑镜科技有限公司
申请日： 2022-11-07 - 公布日： 2023-03-21 - 主分类号： G06T13/40 文献下载
摘要：本发明公开了一种数字人动画的生成方法、装置、电子设备和存储介质，该方法包括：根据目标音频的时长从目标人的真实说话视频中获取源视频帧序列；对各源视频帧中的人脸区域进行3D人脸建模并生成多个第一3D人脸模型；根据目标音频中各音素的时序生成音素序列，并根据各音素的发音时长确定各音素的权重参数；根据音素序列从预设3D人脸模型集合中获取多个第二3D人脸模型；根据时序和各权重参数对各第二3D人脸模型和各第三3D人脸模型进行融合并渲染出多个人脸图像；按时序将各人脸图像分别与各源视频帧进行融合并得到渲染帧序列，根据渲染帧序列和目标音频生成与目标人对应的数字人动画，从而提高了数字人动画中目标人的音频和口型的一致性。
数字动画生成方法装置电子设备存储介质

1
2
3
下一页»
尾页
共 36 条