[发明专利]一种口语语义理解方法、装置及系统在审
申请号: | 201910860179.0 | 申请日: | 2019-09-11 |
公开(公告)号: | CN112487179A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 李明杰;宋德超;贾巨涛;吴伟;黄姿荣 | 申请(专利权)人: | 珠海格力电器股份有限公司;珠海联云科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06F40/289 |
代理公司: | 北京聿宏知识产权代理有限公司 11372 | 代理人: | 吴大建;张杰 |
地址: | 519000*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 口语 语义 理解 方法 装置 系统 | ||
本发明提供一种口语语义理解方法、装置及系统,方法包括:基于文本分类模型对输入的口语文本进行文本分类处理,得到所述口语文本对应的领域和意图;基于实体抽取模型对输入的口语文本进行实体抽取处理,得到所述口语文本对应的实体参数;对所述文本分类处理和所述实体抽取处理的准确度进行评分,获得评分值;当所述评分值大于或等于预设的评分阈值时,根据所述领域,所述意图和所述实体参数,输出结构化信息。该方法利用规则匹配与机器学习模型相结合,在口语语义快速、精准识别的基础上,完成新领域数据的匹配和标签设置,实现新领域口语数据的理解。
技术领域
本发明属于智能控制领域,具体涉及一种口语语义理解方法、装置及系统。
背景技术
在语音交互领域,将自然语言转化为机器能够理解的语义是核心技术内容。语义不仅表述事物本质,还表述事物之间的因果,上下位,事实等各种逻辑关系,语义分析理解就是对信息所包含的语义的识别,并建立一种模型,使其理解相关文本,其中语义理解离不开规则匹配、文本分类、实体识别与抽取等技术。
当前语义理解技术主要分为两种:
(1)模板规则匹配方法:通过设置口语文本模板和规则进行精准匹配。
(2)机器学习方法:利用建立语义分类、实体识别、句式分析等模型进行语义理解。
模板规则匹配方法对于少量语义的处理效果较好,但语料量逐渐增多,会形成意图冲突,句式混乱,层次不明等难以维护情况。机器学习方法训练的模型对标注好的领域具有领域内的适应性,但缺少泛领域能力,对于新的领域语义需要进行重新数据标注和训练才能进行识别。
发明内容
本发明所要解决的技术问题是提供一种口语语义理解技术方案方法、装置及系统,以克服现有技术存在的上述不足。
第一方面,提供一种口语语义理解方法,其包括:
基于文本分类模型对输入的口语文本进行文本分类处理,得到所述口语文本对应的领域和意图;
基于实体抽取模型对输入的口语文本进行实体抽取处理,得到所述口语文本对应的实体参数;
对所述文本分类处理和所述实体抽取处理的准确度进行评分,获得评分值;
当所述评分值大于或等于预设的评分阈值时,根据所述领域,所述意图和所述实体参数,输出结构化信息。
第二方面,提供一种口语语义理解装置,其包括:
文本分类单元,用于基于文本分类模型对输入的口语文本进行文本分类处理,得到所述口语文本对应的领域和意图;
实体抽取单元,用于基于实体抽取模型对输入的口语文本进行实体抽取处理,得到所述口语文本对应的实体参数;
评分单元,用于对所述文本分类处理和所述实体抽取处理的准确度进行评分,获得评分值;
输出判断单元,用于当所述评分值大于或等于预设的评分阈值时,根据所述领域,所述意图和所述实体参数,输出结构化信息。
第三方面,提供一种口语语义理解系统,其包括:
上述的语义理解装置;以及
规则匹配装置;
所述规则匹配装置,用于:当所述评分值小于预设的评分阈值时,根据预设的标签和设计规则模板,对所述输入的口语文本进行语义理解;产生语义理解历史记录,从所述语义理解历史记录中提取带标签的文本数据。
第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的口语语义理解方法。
第五方面,提供一种计算机设备,其包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海格力电器股份有限公司;珠海联云科技有限公司,未经珠海格力电器股份有限公司;珠海联云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910860179.0/2.html,转载请声明来源钻瓜专利网。