[发明专利]智能语音设备的用户账号切换方法在审
申请号: | 201911083446.4 | 申请日: | 2019-11-07 |
公开(公告)号: | CN110782904A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 张成亮;徐庭锐;刘洋廷;郝放;简红美;高玉东;毕可骅;王飞 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | G10L17/18 | 分类号: | G10L17/18;G10L17/06;G10L17/22 |
代理公司: | 51124 成都虹桥专利事务所(普通合伙) | 代理人: | 陈立志 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及智能语音设备领域,公开了一种智能语音设备的用户账号切换方法,用于解决智能语音设备在用户账号切换方面不够快捷的问题。本发明首先采集不同用户说出的唤醒词音频信号,并唤醒词音频信号转换成数字信号,输入到RNN神经网络,将RNN神经网络输出的唤醒词的特征向量进行聚类;当用户进行账号切换并说出唤醒词时,设备采集唤醒词音频信号,并转换成数字信号,输入到与RNN神经网络,将RNN神经网络输出的当前唤醒词的特征向量与各个聚类中心向量求距离,若当前唤醒词的特征向量与最近的聚类中心向量的距离未超出阀值,则将该最近的聚类中心向量作为当前用户的账号,由此进行账号切换。本发明适用于智能语音设备的用户账号切换。 | ||
搜索关键词: | 唤醒 智能语音设备 聚类中心向量 特征向量 用户账号 神经网络输出 神经网络 数字信号 音频信号 账号切换 音频信号转换 设备采集 聚类 采集 转换 | ||
【主权项】:
1.智能语音设备的用户账号切换方法,其特征在于,包括:/n步骤1:采集不同用户说出的唤醒词音频信号,并将词音频信号转换成固定长度的数字信号;/n步骤2:将采集的语音数字信号全部输入到RNN神经网络,RNN神经网络输出唤醒词的特征向量,并将所有特征向量经过聚类算法进行聚类,其中聚类中心向量用作账号标识符;/n步骤3:当用户进行账号切换并说出唤醒词时,设备采集唤醒词音频信号,并将词音频信号转换成固定长度的数字信号;/n步骤4:将步骤3的数字信号输入到与步骤2相同的RNN神经网络,RNN神经网络输出当前唤醒词的特征向量,并将当前唤醒词的特征向量与各个聚类中心向量求距离,若当前唤醒词的特征向量与最近的聚类中心向量的距离未超出阀值,则将该最近的聚类中心向量作为当前用户的账号,由此进行账号切换。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911083446.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种说话人识别方法及可读存储介质
- 下一篇:一种定位方法、装置及系统
- 同类专利
- 智能语音设备的用户账号切换方法-201911083446.4
- 张成亮;徐庭锐;刘洋廷;郝放;简红美;高玉东;毕可骅;王飞 - 四川长虹电器股份有限公司
- 2019-11-07 - 2020-02-11 - G10L17/18
- 本发明涉及智能语音设备领域,公开了一种智能语音设备的用户账号切换方法,用于解决智能语音设备在用户账号切换方面不够快捷的问题。本发明首先采集不同用户说出的唤醒词音频信号,并唤醒词音频信号转换成数字信号,输入到RNN神经网络,将RNN神经网络输出的唤醒词的特征向量进行聚类;当用户进行账号切换并说出唤醒词时,设备采集唤醒词音频信号,并转换成数字信号,输入到与RNN神经网络,将RNN神经网络输出的当前唤醒词的特征向量与各个聚类中心向量求距离,若当前唤醒词的特征向量与最近的聚类中心向量的距离未超出阀值,则将该最近的聚类中心向量作为当前用户的账号,由此进行账号切换。本发明适用于智能语音设备的用户账号切换。
- 一种基于深度学习的声纹识别方法、装置及设备-201910894120.3
- 王健宗;赵峰 - 平安科技(深圳)有限公司
- 2019-09-20 - 2020-02-07 - G10L17/18
- 本申请属于生物识别领域,公开了一种基于深度学习的声纹识别方法、装置及设备,其中,所述方法包括:获取目标人的认证语音,利用MFCC对认证语音进行特征提取,得到认证语音特征;将认证语音特征输入神经网络模型进行认证处理;根据认证处理结果对神经网络模型内部的函数的参数进行调整,得到能够对目标人语音的进行识别的目标神经网络模型;利用MFCC对获取的待识别的语音进行特征提取,得到待识别的语音特征;将待识别的语音特征输入目标神经网络模型进行语音识别处理,确定待识别的语音是否属于目标人。利用训练得到的神经网络模型对语音进行识别,确定语音是否是目标人本人,语音识别过程比较快速精准,使得识别效率得到有效的提高。
- 人物图像生成方法、交互方法、装置及终端设备-201910838071.1
- 马凯 - 深圳追一科技有限公司
- 2019-09-05 - 2020-01-03 - G10L17/18
- 本申请公开了一种人物图像生成方法、交互方法、装置及终端设备,该方法包括:获取目标说话人的语音信息;对所述语音信息进行预处理,得到处理后的语音信息;从所述处理后的语音信息中提取出语音特征;将所述语音特征输入至预先训练得到的神经网络模型,得到与所述目标说话人对应的人物画像,所述人物画像包括人物的脸部特征、体型特征、性别特征、以及年龄特征中的至少一种。不仅实现了人物画像的快速生成,而且保证生成人物画像的真实性和准确性。
- 专利分类