[发明专利]一种语音处理方法及终端设备有效
申请号: | 201910330337.1 | 申请日: | 2019-04-23 |
公开(公告)号: | CN110111795B | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 周泽 | 申请(专利权)人: | 维沃移动通信有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L25/00;G10L25/63;G10L25/48;G06F16/635 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 523860 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 处理 方法 终端设备 | ||
1.一种语音处理方法,应用于终端设备,其特征在于,包括:
采集所述终端设备所处目标场景中的N个发声对象的N个语音数据;
基于所述语音数据,确定每个发声对象的发声意图信息;
获取所述目标场景的场景关联信息;
基于每个发声对象的发声意图信息和所述目标场景的场景关联信息,输出与目标发声对象关联的目标帮助信息,以实现所述终端设备与所述目标发声对象的交流;
所述基于每个发声对象的发声意图信息和所述目标场景的场景关联信息,输出与目标发声对象关联的目标帮助信息,包括:
根据所述发声意图信息,确定是否输出所述目标帮助信息。
2.根据权利要求1所述的方法,其特征在于,所述基于所述语音数据,确定每个发声对象的发声意图信息,包括:
基于所述语音数据,确定每个发声对象的发声意图类型;
基于所述发声意图类型,确定每个发声对象的发声意图信息;
其中,所述发声意图类型包括以下至少一项:生活服务类型、影视类型、百科类型、文学类型。
3.根据权利要求1所述的方法,其特征在于,所述基于所述语音数据,确定每个发声对象的发声意图信息,包括:
对所述语音数据进行特征分析,得到每个发声对象的发声意图信息;
其中,所述特征分析包括以下至少一项:语义分析、情感分析、类别分析、场景分析、声源分析、匹配分析、逻辑分析。
4.根据权利要求1所述的方法,其特征在于,所述获取所述目标场景的场景关联信息,包括:
基于所述语音数据,获取所述目标场景的环境特征信息;其中,所述环境特征信息包括以下至少一项:环境属性信息、场景类型信息;
采集每个发声对象的图像信息,并基于每个发声对象的图像信息获取每个发声对象的人物特征信息;其中,所述人物特征信息包括以下至少一项:基本信息、属性信息、兴趣偏好信息、交流习惯信息、生理特征信息、行为习惯信息、知识储备信息;
其中,所述目标场景的场景关联信息包括所述目标场景的环境特征信息和每个发声对象的人物特征信息。
5.根据权利要求1所述的方法,其特征在于,所述基于每个发声对象的发声意图信息和所述目标场景的场景关联信息,输出与目标发声对象关联的目标帮助信息,包括:
基于每个发声对象的发声意图信息和所述目标场景的场景关联信息,分别匹配公共网络信息和本地存储信息;
基于预存的知识图谱,对所述公共网络信息和所述本地存储信息进行数据处理;
基于数据处理后的所述公共网络信息和所述本地存储信息,输出与目标发声对象关联的目标帮助信息;
其中,基于预存的知识图谱进行的数据处理包括以下至少一项:自学习处理、自升级处理、智能预测处理、筛选处理。
6.根据权利要求1所述的方法,其特征在于,所述输出与目标发声对象关联的目标帮助信息,包括以下至少一项:
通过播放语音的方式,输出与目标发声对象关联的目标帮助信息;
通过显示画面的方式,输出与目标发声对象关联的目标帮助信息;
其中,所述目标帮助信息包括图像信息和文字信息中的至少一项。
7.根据权利要求1所述的方法,其特征在于,所述输出与目标发声对象关联的目标帮助信息,包括以下至少一项:
通过终端,输出与目标发声对象关联的目标帮助信息;
通过空气传播,输出与目标发声对象关联的目标帮助信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于维沃移动通信有限公司,未经维沃移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910330337.1/1.html,转载请声明来源钻瓜专利网。