[发明专利]语义解析方法、装置及存储介质有效
申请号: | 201910936998.9 | 申请日: | 2019-09-29 |
公开(公告)号: | CN110705267B | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 张龙;赵科;殷切 | 申请(专利权)人: | 阿波罗智联(北京)科技有限公司 |
主分类号: | G06F40/247 | 分类号: | G06F40/247;G06F40/30 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张娜;刘芳 |
地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 解析 方法 装置 存储 介质 | ||
本申请公开了一种语义解析方法、装置及存储介质,涉及语音技术领域。具体实现方案为:终端设备通过获取语音信号对应的文本信息,在对文本信息进行预处理后确定语音信号对应的第一拼读信息,该第一拼读信息指示的是用户真实的文本含义,通过对第一拼读信息进行槽位模板匹配过程,生成语义解析结果,该语义解析结果指示了用户在当前场景的真实意图。本申请采用槽位模板匹配方案,适用于终端离线场景,该方案的语义泛化程度高,终端的资源消耗小,扩展性强。
技术领域
本申请涉及人工智能技术领域,尤其涉及语音技术中的语义解析方法、装置及存储介质。
背景技术
人工智能(Artificial Intelligence,简称AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等,其主要目标是使机器能够胜任一些需要人类智慧才能完成的复杂工作。
语音识别技术就是人工智能领域的一个研究方向,它是让机器通过识别和理解过程把语音信号转变为相应的本文或者命令的技术。因此,对语音信号的语义解析十分关键。目前语义解析方案包括两大类,一类是在线语义解析,可采用泛化程度较高的深度学习模型,由于其占用的内存空间较大,通常设置在云端,终端设备可以通过与云端服务器交互,理解语音信号并执行相应的操作。当然上述模型也可以应用于离线状态,但由于模型占用空间较大,对终端设备的性能影响较大。另一类是离线语义解析,通常采用文本匹配的方案,终端设备预存可识别的文本数据,但由于文本数据需要逐一配置,该方案的泛化程度较低,往往无法满足离线用户的实际需求。
因此,亟需设计一种离线语义解析方案,提升语义解析的泛化程度。
发明内容
本申请提供一种语义解析方法、装置及存储介质,提升了离线语义解析的泛化程度。
本申请第一方面提供一种语义解析方法,包括:
获取语音信号对应的文本信息;
根据所述文本信息确定所述语音信号对应的第一拼读信息,所述第一拼读信息是所述文本信息中的文本对应的拼读信息;
对所述第一拼读信息进行槽位模板匹配,生成语义解析结果。
在本方案中,终端设备通过获取语音信号对应的文本信息,根据文本信息确定语音信号对应的第一拼读信息,该第一拼读信息指示的是用户真实的文本含义,通过对第一拼读信息进行槽位模板匹配过程,生成语义解析结果,该语义解析结果指示了用户在当前场景的真实意图。本方案采用槽位模板匹配方案,语义泛化程度高,终端的资源消耗小,扩展性强。
在一种可能的实现方式中,所述根据所述文本信息确定所述语音信号对应的第一拼读信息,包括:
将所述文本信息转换为第二拼读信息;
通过查询预存的纠错字典,对所述第二拼读信息进行纠错处理,得到所述语音信号对应的第一拼读信息;其中,所述纠错字典包括当前场景对应的常用术语,以及所述常用术语对应的正确拼读信息和错误拼读信息。
可选的,所述纠错处理包括同音纠错、近音纠错、缺音纠错的至少一项。
上述的实现方式纠正了文本信息,提高了语音识别的准确率。
在一种可能的实现方式中,所述对所述第一拼读信息进行槽位模板匹配,生成语义解析结果,包括:
基于预存的槽位字典对所述第一拼读信息进行槽位解析,得到槽位列表;其中,所述槽位字典包括当前场景对应的常用术语的拼读信息与程序化语言的对应关系,所述槽位列表包括名词槽位、动词槽位;
根据预设的模板字典的规则对所述槽位列表进行模板分析,生成语义解析结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿波罗智联(北京)科技有限公司,未经阿波罗智联(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910936998.9/2.html,转载请声明来源钻瓜专利网。