[发明专利]一种语音处理方法及终端设备有效
申请号: | 201910330337.1 | 申请日: | 2019-04-23 |
公开(公告)号: | CN110111795B | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 周泽 | 申请(专利权)人: | 维沃移动通信有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L25/00;G10L25/63;G10L25/48;G06F16/635 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 523860 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 处理 方法 终端设备 | ||
本发明实施例提供了一种语音处理方法及终端设备,涉及通信技术领域,以解决常见的语音处理方式都是基于用户主动发起的,从而导致人与终端,或者终端与终端之间交流受限的问题。其中,所述语音处理方法,包括:采集终端设备所处目标场景中的N个发声对象的N个语音数据;基于所述语音数据,确定每个发声对象的发声意图信息;获取所述目标场景的场景关联信息;基于每个发声对象的发声意图信息和所述目标场景的场景关联信息,输出与目标发声对象关联的目标帮助信息。本发明实施例中的语音处理方法应用于终端设备中。
技术领域
本发明实施例涉及通信技术领域,尤其涉及一种语音处理方法及终端设备。
背景技术
随着科技的发展,人们的生活越来越智能化。交流形式不再局限于人与人之间的口耳交流,而是逐渐发展为人与终端之间的交流方式、终端与终端之间的交流方式,等等。
例如,智能手机中的人工智能(Artificial Intelligence,简称AI)助理能够识别用户发出的语音,并对识别的语音进行相应的处理,从而输出相关内容,实现与用户之间的交流,从而帮助用户解决一些问题。
目前,常见的语音处理方式都是基于用户主动发起的,从而导致人与终端,或者终端与终端之间交流受限。
发明内容
本发明实施例提供一种语音处理方法,以解决常见的语音处理方式都是基于用户主动发起的,从而导致人与终端,或者终端与终端之间交流受限的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种语音处理方法,应用于终端设备,包括:采集所述终端设备所处目标场景中的N个发声对象的N个语音数据;基于所述语音数据,确定每个发声对象的发声意图信息;获取所述目标场景的场景关联信息;基于每个发声对象的发声意图信息和所述目标场景的场景关联信息,输出与目标发声对象关联的目标帮助信息。
第二方面,本发明实施例还提供了一种终端设备,包括:语音数据采集模块,用于采集所述终端设备所处目标场景中的N个发声对象的N个语音数据;发声意图确定模块,用于基于所述语音数据,确定每个发声对象的发声意图信息;关联信息获取模块,用于获取所述目标场景的场景关联信息;帮助信息输出模块,用于基于每个发声对象的发声意图信息和所述目标场景的场景关联信息,输出与目标发声对象关联的目标帮助信息。
优选地,所述发声意图确定模块包括:意图类型确定单元,用于基于所述语音数据,确定每个发声对象的发声意图类型;意图信息确定单元,用于基于所述发声意图类型,确定每个发声对象的发声意图信息;其中,所述发声意图类型包括以下至少一项:生活服务类型、影视类型、百科类型、文学类型。
优选地,所述发声意图确定模块包括:分析单元,用于对所述语音数据进行特征分析,得到每个发声对象的发声意图信息;其中,所述特征分析包括以下至少一项:语义分析、情感分析、类别分析、场景分析、声源分析、匹配分析、逻辑分析。
优选地,所述关联信息获取模块包括:环境特征信息获取单元,用于基于所述语音数据,获取所述目标场景的环境特征信息;其中,所述环境特征信息包括以下至少一项:环境属性信息、场景类型信息;人物特征信息获取单元,用于采集每个发声对象的图像信息,并基于每个发声对象的图像信息获取每个发声对象的人物特征信息;其中,所述人物特征信息包括以下至少一项:基本信息、属性信息、兴趣偏好信息、交流习惯信息、生理特征信息、行为习惯信息、知识储备信息;其中,所述目标场景的场景关联信息包括所述目标场景的环境特征信息和每个发声对象的人物特征信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于维沃移动通信有限公司,未经维沃移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910330337.1/2.html,转载请声明来源钻瓜专利网。