[发明专利]个性化虚拟人的生成方法及系统有效
申请号: | 202310341370.0 | 申请日: | 2023-04-03 |
公开(公告)号: | CN116400806B | 公开(公告)日: | 2023-10-17 |
发明(设计)人: | 胡颖;傅小兰;马珠江;沈一;王晓怡 | 申请(专利权)人: | 中国科学院心理研究所;北京智精灵科技有限公司 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G06T13/00;G10L21/10;G06V40/16;G06F16/535;G06F16/635 |
代理公司: | 北京汲智翼成知识产权代理事务所(普通合伙) 11381 | 代理人: | 陈曦;韩正魁 |
地址: | 100101 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 个性化 虚拟 生成 方法 系统 | ||
本发明公开了一种个性化虚拟人的生成方法及系统。该生成方法包括如下步骤:基于目标群体的文本信息和声音信息,预先建立通用虚拟人模型和通用声音模型;获取用户偏好的通用虚拟人模型和通用声音模型;获取用户的偏好面孔信息和偏好音乐信息;基于用户偏好的通用虚拟人模型与偏好面孔信息,生成个性化面孔模型;基于用户偏好的通用声音模型与偏好音乐信息,生成个性化声音模型;根据个性化面孔模型与个性化声音模型,融合生成个性化虚拟人。该生成方法通过真实场景中的医生形象建模,采用人脸融合技术提取医生共有的面部特征值,建立虚拟医生模版,进一步通过用户自主选择熟悉的面孔和声音,与虚拟人进行融合生成高度个性化的虚拟人。
技术领域
本发明涉及一种个性化虚拟人的生成方法,同时也涉及相应的个性化虚拟人生成系统,属于人机交互技术领域。
背景技术
广义的虚拟人指由计算机动画(Computer Graphics,简称为CG)技术构建、以代码形式运行的拟人化形象。概括地说,虚拟人、数字人、虚拟数字人均指通过CG技术创造出的拟人化形象,它们被赋予鲜明的人物设定,以代码与数据的形式在计算设备上运行。其中,虚拟人强调其在外观上与真人的相似性;数字人强调其存在于二进制的数字世界中,既可以是根据真人生成的1:1数字孪生,亦可以是完全虚构的形象与身份;虚拟数字人则有着更为严格的定义,根据人工智能产业发展联盟发布的《2020年虚拟数字人发展白皮书》,虚拟数字人具备三大特征:1)拥有人的外观及性格特征;2)拥有通过语言、表情或肢体动作表达的能力;3)拥有识别外界环境、与人交流互动的能力。
虚拟人在医疗健康领域可以兼备虚拟专家和虚拟陪伴两种功能。一方面,可利用深度学习技术,自动识别临床数据指标,模拟医生思维和诊断推理,同时进行病人的检查报告分析,提供诊疗建议。另一方面,可直接服务于社区和个人用户,为不同阶层人群提供专业化智能陪伴。未来,虚拟人技术将成为人们日常体验不可缺少的一部分,在医疗健康领域带来重要的潜在应用。
当前,老年认知障碍疾病人群的照护服务需求呈现快速增长趋势,但家庭和社会照护服务能力却明显不足。为此,在申请号为202211006866.4的中国专利申请中,公开了一种基于神经网络的元宇宙情感陪护虚拟人实现方法及系统,陪护委托人构建客制化的元宇宙虚拟人及空间以托管与老人情感沟通的时间,提高了被陪护人在情感陪护过程中虚拟人对象的智能性,增强其在接受陪护时的真实感、亲切感与沉浸感;通过智能技术建立虚拟人聊天后端和学习系统,使虚拟人从形象到语音再到聊天内容特点都具有高度可客制化、个性化特性,解决了传统机器人情感陪护的机械死板且单一的问题,使机器情感陪护可以进行量身定制与随使用自适应学习改进;通过图像与建模技术建立虚拟人所处的场景,在场景营造、细节还原等方面逼近现实,进一步增强情感陪护过程的观感真实性,并与信息反馈机制结合,提高信息反馈效率与准确性。
发明内容
本发明所要解决的首要技术问题在于提供一种个性化虚拟人的生成方法。
本发明所要解决的另一技术问题在于提供一种个性化虚拟人的生成系统。
为实现上述目的,本发明采用以下的技术方案:
根据本发明实施例的第一方面,提供一种个性化虚拟人的生成方法,包括如下步骤:
基于目标群体的文本信息,预先建立通用虚拟人模型Fm,其中,m为所述通用虚拟人模型的数量,m∈[1,m];
基于目标群体的声音信息,预先建立通用声音模型Vn,其中,n为所述通用声音模型的数量,n∈[1,n];
在所述通用虚拟人模型中,获取用户偏好的通用虚拟人模型;并在所述通用声音模型中,获取用户偏好的通用声音模型;
获取所述用户的偏好面孔信息和偏好音乐信息;
基于所述用户偏好的通用虚拟人模型与所述用户的偏好面孔信息,生成个性化面孔模型;并基于所述用户偏好的通用声音模型与所述用户的偏好音乐信息,生成个性化声音模型;
根据所述个性化面孔模型与所述个性化声音模型,融合生成个性化虚拟人。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院心理研究所;北京智精灵科技有限公司,未经中国科学院心理研究所;北京智精灵科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310341370.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:纸箱印刷机
- 下一篇:变速器冷却润滑流量预测方法、系统、车辆及存储介质