[发明专利]基于服务场景识别的语音数据处理方法及相关装置有效
申请号: | 202211306175.6 | 申请日: | 2022-10-25 |
公开(公告)号: | CN115374793B | 公开(公告)日: | 2023-01-20 |
发明(设计)人: | 顾蓝笛;韩婧 | 申请(专利权)人: | 深圳市人马互动科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/279;G06F40/194;G10L15/30;G10L15/26;G10L15/18 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 王勤 |
地址: | 518000 广东省深圳市南山区粤海街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 服务 场景 识别 语音 数据处理 方法 相关 装置 | ||
本发明公开了一种基于服务场景识别的语音数据处理方法及相关装置,应用于语音互动系统,该方法包括:接收来自电子设备的用户在当前次对话事件中所录入的语音信息,通过人机互动引擎执行如下操作:将语音信息转换为原始文本;根据当前次对话事件的对话内容和/或事件关联信息确定当前次对话事件所属的目标服务场景,事件关联信息包括以下至少一种:电子设备在当前次对话事件中提供的服务或应用的类型、电子设备的设备类型;获取目标服务场景的基准词语集合;根据基准词语集合对原始文本进行分词,得到原始文本的适配目标服务场景的至少一个文本句式;根据至少一个文本句式对原始文本进行语义分析,得到语义分析结果。提高了语义识别的准确率。
技术领域
本发明涉及语音数据的一般数据处理领域,尤其涉及一种基于服务场景识别的语音数据处理方法及相关装置。
背景技术
语音互动系统在与用户进行互动时需要将用户的语音信息转换为文字信息,然后对文字进行分词分析来推测用户的语义,在对外部输入的语句进行语义分析时,需要穷举所有的分词方式,得到多个文本句式,然后在对得到的多个文本句式进行分析,才能确定出最终用于进行语义分析的目标文本。这样在用户一次输入的语句过长,且该句中存在多个有歧义的词时,计算量就会增大。
发明内容
针对上述问题,本申请实例提供了一种基于服务场景识别的语音数据处理方法及相关装置,根据用户的目标服务场景来确定用户语音信息的基准词语,根据基准词语对用户的语音信息进行分词可以减少语音互动系统的计算量,提高分析的准确率。
为实现上述目的,第一方面,本申请实施例提供了一种基于服务场景识别的语音数据处理方法,应用于语音互动系统的服务器,服务器设置有人机互动引擎,语音互动系统还包括与服务器通信连接的电子设备,该方法包括:接收来自电子设备的用户在当前次对话事件中所录入的语音信息,通过人机互动引擎执行如下操作:将语音信息转换为原始文本;根据当前次对话事件的对话内容和/或事件关联信息确定当前次对话事件所属的目标服务场景,事件关联信息包括以下至少一种:电子设备在当前次对话事件中提供的服务或应用的类型、电子设备的设备类型;获取目标服务场景的基准词语集合;根据基准词语集合对原始文本进行分词,得到原始文本的适配目标服务场景的至少一个文本句式;根据至少一个文本句式对原始文本进行语义分析,得到语义分析结果。
可以看出在本申请实施例中,通过确定用户在使用人机互动系统时的目标服务场景,可以得到目标服务场景下的基准词语集合,已确认根据用户的语音信息得到的原始文本的目标服务场景下的基准词语。根据基准词语可以得到最符合逻辑的分词文本句式,从而提高了语音互动模型的语义分析正确率,降低了语音互动系统的计算量进而提高了系统的分析效率。
结合第一方面,在一种可能的实施例中,该至少一个文本句式包括多个,根据至少一个文本句式对原始文本进行语义分析之前,该方法还包括:确定每个文本句式包括的词语中存在单字的文本句式为目标文本句式;确定目标文本句式中包括的单字的可实现性;从多个文本句式中删除可实现性低于预设值的文本句式。
可以看出在本申请实施例中,通过计算存在单字分词的文本句式下单字的可实现性,在对文本句式进行逻辑检测前,初步排除了一部分单字的可实现性过低的文本句式,从而减少了语音互动系统的计算量进而提高了系统的分析效率。
结合第一方面,在一种可能的实施例中,至少一个文本句式包括多个,根据至少一个文本句式对原始文本进行语义分析,包括:以每个文本句式中包括的基准词语为基础,对每个文本句式进行逻辑检测,得到每个文本句式的逻辑得分;对逻辑得分最高的文本句式进行语义分析,得到语义分析结果。
结合第一方面,在一种可能的实施例中,以每个文本句式中包括的基准词语为基础,对每个文本句式进行逻辑检测,得到每个文本句式的逻辑得分,包括:确定每个文本句式中与基准词语相邻的词语为校验词语;确定基准词语与校验词语组合成一个短语的可能性评分;根据可能性评分确定每个文本句式的逻辑得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市人马互动科技有限公司,未经深圳市人马互动科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211306175.6/2.html,转载请声明来源钻瓜专利网。