[发明专利]人物图像生成方法、交互方法、装置及终端设备在审

专利信息
申请号: 201910838071.1 申请日: 2019-09-05
公开(公告)号: CN110648672A 公开(公告)日: 2020-01-03
发明(设计)人: 马凯 申请(专利权)人: 深圳追一科技有限公司
主分类号: G10L17/18 分类号: G10L17/18;G10L17/02
代理公司: 44351 深圳市智圈知识产权代理事务所(普通合伙) 代理人: 苗燕
地址: 518057 广东省深圳市南山区粤海街道*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 人物画像 语音信息 语音特征 预处理 神经网络模型 获取目标 快速生成 脸部特征 人物图像 体型特征 性别特征 终端设备 音信息 真实性 申请 保证
【说明书】:

本申请公开了一种人物图像生成方法、交互方法、装置及终端设备,该方法包括:获取目标说话人的语音信息;对所述语音信息进行预处理,得到处理后的语音信息;从所述处理后的语音信息中提取出语音特征;将所述语音特征输入至预先训练得到的神经网络模型,得到与所述目标说话人对应的人物画像,所述人物画像包括人物的脸部特征、体型特征、性别特征、以及年龄特征中的至少一种。不仅实现了人物画像的快速生成,而且保证生成人物画像的真实性和准确性。

技术领域

本申请涉及终端设备技术领域,更具体地,涉及一种人物图像生成方法、交互方法、装置及终端设备。

背景技术

目前,想要得到一个未知人物的人物画像,通常需要有对该人物的肖像描述,并且由专业的肖像画家基于肖像描述进行绘画。

然而,现有的获取未知人物的人物画像的方法比较麻烦,不仅费时费力,而且由于肖像画家在画人物画像时,也会掺杂肖像画家的主观意识,因此做出的人物画像也不一定准确。

发明内容

鉴于上述问题,本申请提出了一种人物图像生成方法、交互方法、装置、终端设备及存储介质,可根据目标说话人的语音信息生成该目标说话人的人物画像,简化了人物画像的获取过程。

第一方面,本申请例提供了一种人物图像生成方法,该方法包括:获取目标说话人的语音信息;对语音信息进行预处理,得到处理后的语音信息;从处理后的语音信息中提取出语音特征;将语音特征输入至预先训练得到的神经网络模型,得到与目标说话人对应的人物画像,人物画像包括人物的脸部特征、体型特征、性别特征、以及年龄特征中的至少一种。

可选地,将语音特征输入至预先训练得到的神经网络模型之前,还包括:获取训练样本集,训练样本集包括从训练视频中提取的训练语音特征以及与训练音频对应的人物画像;将训练样本集输入到机器学习模型,并对机器学习模型进行训练,得到神经网络模型。

可选地,将训练样本集输入到机器学习模型,并对机器学习模型进行训练,包括:从训练语音特征中选取出基频;将基频以及与基频对应的性别特征输入到机器学习模型,并对机器学习模型进行训练。

可选地,将基频以及与基频对应的性别特征输入到机器学习模型,包括:将大于或等于200Hz的基频对应于女性性别特征;将小于200Hz的基频对应于男性性别特征。

可选地,将训练样本集输入到机器学习模型,并对机器学习模型进行训练,包括:从训练语音特征中选取出共振峰;将共振峰以及与共振峰对应的性别特征输入到机器学习模型,并对机器学习模型进行训练。

可选地,预处理包括预加重、端点检测、分帧加窗。

第二方面,本申请例提供了一种人物图像交互方法,应用于视频客服系统,视频客服系统包括用户端和与用户端网络通信的客服端,该方法包括:上述的人物图像生成方法,该方法还包括:

基于人物画像生成与人物画像对应的虚拟客服形象;当目标说话人开启视频客服时,在用户端显示虚拟客服形象。

可选地,基于人物画像生成与人物画像对应的虚拟客服形象,包括:根据人物画像中的性别特征确定目标说话人是否为男性;若为男性,从虚拟客服形象数据库中选取一个女性样貌的虚拟客服形象,并将女性样貌的虚拟客服形象确定为虚拟客服形象。

可选地,当目标说话人开启视频客服时,在客服端显示人物画像。

可选地,方法还包括:获取样本面部特征、样本交互信息以及样本人脸图像;将样本面部特征点和样本交互信息输入至第一机器学习模型中进行训练,得到第一模型;将样本人脸图像和样本面部特征点输入至第二机器学习模型中进行训练,得到第二模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳追一科技有限公司,未经深圳追一科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910838071.1/2.html,转载请声明来源钻瓜专利网。

同类专利
  • 智能语音设备的用户账号切换方法-201911083446.4
  • 张成亮;徐庭锐;刘洋廷;郝放;简红美;高玉东;毕可骅;王飞 - 四川长虹电器股份有限公司
  • 2019-11-07 - 2020-02-11 - G10L17/18
  • 本发明涉及智能语音设备领域,公开了一种智能语音设备的用户账号切换方法,用于解决智能语音设备在用户账号切换方面不够快捷的问题。本发明首先采集不同用户说出的唤醒词音频信号,并唤醒词音频信号转换成数字信号,输入到RNN神经网络,将RNN神经网络输出的唤醒词的特征向量进行聚类;当用户进行账号切换并说出唤醒词时,设备采集唤醒词音频信号,并转换成数字信号,输入到与RNN神经网络,将RNN神经网络输出的当前唤醒词的特征向量与各个聚类中心向量求距离,若当前唤醒词的特征向量与最近的聚类中心向量的距离未超出阀值,则将该最近的聚类中心向量作为当前用户的账号,由此进行账号切换。本发明适用于智能语音设备的用户账号切换。
  • 一种基于深度学习的声纹识别方法、装置及设备-201910894120.3
  • 王健宗;赵峰 - 平安科技(深圳)有限公司
  • 2019-09-20 - 2020-02-07 - G10L17/18
  • 本申请属于生物识别领域,公开了一种基于深度学习的声纹识别方法、装置及设备,其中,所述方法包括:获取目标人的认证语音,利用MFCC对认证语音进行特征提取,得到认证语音特征;将认证语音特征输入神经网络模型进行认证处理;根据认证处理结果对神经网络模型内部的函数的参数进行调整,得到能够对目标人语音的进行识别的目标神经网络模型;利用MFCC对获取的待识别的语音进行特征提取,得到待识别的语音特征;将待识别的语音特征输入目标神经网络模型进行语音识别处理,确定待识别的语音是否属于目标人。利用训练得到的神经网络模型对语音进行识别,确定语音是否是目标人本人,语音识别过程比较快速精准,使得识别效率得到有效的提高。
  • 人物图像生成方法、交互方法、装置及终端设备-201910838071.1
  • 马凯 - 深圳追一科技有限公司
  • 2019-09-05 - 2020-01-03 - G10L17/18
  • 本申请公开了一种人物图像生成方法、交互方法、装置及终端设备,该方法包括:获取目标说话人的语音信息;对所述语音信息进行预处理,得到处理后的语音信息;从所述处理后的语音信息中提取出语音特征;将所述语音特征输入至预先训练得到的神经网络模型,得到与所述目标说话人对应的人物画像,所述人物画像包括人物的脸部特征、体型特征、性别特征、以及年龄特征中的至少一种。不仅实现了人物画像的快速生成,而且保证生成人物画像的真实性和准确性。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top