[发明专利]语音识别和语义理解的一体化方法、系统和电子设备在审
申请号: | 202310074251.3 | 申请日: | 2023-01-30 |
公开(公告)号: | CN116052663A | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 樊帅;朱成亚;甘津瑞 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/05;G06F40/35 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;侯晓艳 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 语义 理解 一体化 方法 系统 电子设备 | ||
1.一种语音识别和语义理解的一体化方法,包括:
对实时检测到的用户语音进行语音识别,得到所述用户语音的实时识别文本;
将所述实时识别文本输入至语义完整度判决模块,用于判断所述实时识别文本是否具有完整语义;
若所述实时识别文本具有完整语义,对所述实时识别文本进行语义解析,得到所述实时识别文本对应的实时语义解析结果;
当检测到所述用户语音停止时,通过所述语音识别得到最终识别文本,将所述最终识别文本与所述实时识别文本进行对比,若对比结果为相同,则将所述实时识别文本对应的实时语义解析结果确定为所述用户语音的最终语义解析结果。
2.根据权利要求1所述的方法,其中,所述语义完整度判决模块包括:由对话训练数据训练的二分类机器学习模型,其中,所述二分类机器学习模型包括机器学习模型、深度学习模型、基于数据的预训练模型。
3.根据权利要求1所述的方法,其中,所述语义完整度判决模块包括:由用户的请求数据以及所述用户的自定义语义数据生成的语义资源库;
所述将所述实时识别文本输入至语义完整度判决模块包括:
将所述实时识别文本与所述语义资源库进行匹配,若匹配成功,则确定所述实时识别文本具有完整语义。
4.根据权利要求2-3中任一项所述的方法,其中,语义完整度判决模块包括:由对话训练数据训练的二分类机器学习模型以及由用户的请求数据以及所述用户的自定义语义数据生成的语义资源库;
所述将所述实时识别文本输入至语义完整度判决模块包括:
基于所述二分类机器学习模型确定出所述实时识别文本的第一判决结果;
基于所述语义资源库匹配出所述实时识别文本的第二判决结果;
基于所述第一判决结果以及所述第二判决结果确定所述实时识别文本是否具有完整语义。
5.根据权利要求1所述的方法,其中,所述方法还包括:若所述实时识别文本不具有完整语义,则不进行语义解析。
6.根据权利要求1所述的方法,其中,所述将所述最终识别文本与所述实时识别文本进行对比包括:
若对比结果为不同,则对所述最终识别文本进行语义解析,得到所述用户语音的最终语义解析结果。
7.根据权利要求1所述的方法,其中,所述实时检测到的用户语音由语音端点检测方法确定。
8.一种语音识别和语义理解的一体化系统,包括:
语音识别程序模块,用于对实时检测到的用户语音进行语音识别,得到所述用户语音的实时识别文本;
完整度判断程序模块,用于将所述实时识别文本输入至语义完整度判决模块,用于判断所述实时识别文本是否具有完整语义;
语义解析程序模块,用于若所述实时识别文本具有完整语义,对所述实时识别文本进行语义解析,得到所述实时识别文本对应的实时语义解析结果;
语义确定程序模块,用于当检测到所述用户语音停止时,通过所述语音识别得到最终识别文本,将所述最终识别文本与所述实时识别文本进行对比,若对比结果为相同,则将所述实时识别文本对应的实时语义解析结果确定为所述用户语音的最终语义解析结果。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7中任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310074251.3/1.html,转载请声明来源钻瓜专利网。