[发明专利]年龄判别模型训练及智能语音交互方法、设备及存储介质有效
申请号: | 201711365962.7 | 申请日: | 2017-12-18 |
公开(公告)号: | CN108281138B | 公开(公告)日: | 2020-03-31 |
发明(设计)人: | 陆永帅 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/04;G10L15/16;G10L15/22;G10L21/06 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 年龄 判别 模型 训练 智能 语音 交互 方法 设备 存储 介质 | ||
本发明公开了年龄判别模型训练及智能语音交互方法、设备及存储介质,可预先训练得到一个年龄判别模型,当获取到用户输入的语音数据后,可按照预定时长对语音数据进行切分,并分别获取切分得到的各语音数据段的语谱图,之后,可分别将各语谱图输入年龄判别模型,得到输出的语谱图对应的年龄类别,并根据得到的各年龄类别确定出用户的年龄类别,进而向用户返回与用户的年龄类别以及语音数据的语音识别结果相对应的服务内容。应用本发明所述方案,能够提升获取到的年龄信息的准确性,并提升智能语音交互设备的智能性和趣味性等。
【技术领域】
本发明涉及计算机应用技术,特别涉及年龄判别模型训练及智能语音交互方法、设备及存储介质。
【背景技术】
随着技术的发展,智能语音交互设备越来越普及,如音箱、故事机等。
使用音箱或故事机等智能语音交互设备的,可能是儿童,也可能是成人,还可能是老人等,对于不同年龄类别(儿童、成人等)的用户输入的语音数据即语音query,按照现有处理方式,返回的服务内容通常都是一样的。
如果能够区分出用户的年龄类别,然后有针对性地返回与用户的年龄类别相对应的服务内容,无疑能够提升智能语音交互设备的智能性和趣味性。
另外,现有技术中,通常采用以下方式来获取用户的年龄信息:让用户绑定某个账号,从后台的账号关联数据得到用户的年龄信息,但后台的账号关联数据有可能是用户胡乱填写的,从而导致得到的年龄信息不准确。
【发明内容】
有鉴于此,本发明提供了年龄判别模型训练及智能语音交互方法、设备及存储介质,能够提升获取到的年龄信息的准确性,并提升智能语音交互设备的智能性和趣味性。
具体技术方案如下:
一种年龄判别模型训练方法,包括:
分别获取不同年龄类别的语音数据;
分别按照预定时长对各语音数据进行切分;
分别获取切分得到的各语音数据段的语谱图;
将获取到的各语谱图作为样本,将每个样本对应的语音数据的年龄类别作为所述样本的标签;
根据所述样本及标签训练得到年龄判别模型。
根据本发明一优选实施例,所述分别按照预定时长对各语音数据进行切分包括:
分别对各语音数据按秒进行切分,得到时长为1秒的各语音数据段。
根据本发明一优选实施例,所述分别按照预定时长对各语音数据进行切分之前,进一步包括:
分别将各语音数据转换为预定格式。
根据本发明一优选实施例,所述年龄判别模型包括:支持向量机模型、卷积神经网络模型、深度残差网络模型。
一种智能语音交互方法,包括:
获取用户向智能语音交互设备输入的语音数据;
按照预定时长对所述语音数据进行切分;
分别获取切分得到的各语音数据段的语谱图;
分别将各语谱图输入预先训练得到的年龄判别模型,得到输出的语谱图对应的年龄类别;
根据得到的各年龄类别确定出所述用户的年龄类别;
向所述用户返回与所述用户的年龄类别以及所述语音数据的语音识别结果相对应的服务内容。
根据本发明一优选实施例,所述按照预定时长对所述语音数据进行切分包括:
对所述语音数据按秒进行切分,得到时长为1秒的各语音数据段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711365962.7/2.html,转载请声明来源钻瓜专利网。