[发明专利]一种修正自然语言理解模块的方法、装置及电子设备在审
申请号: | 201811577608.5 | 申请日: | 2018-12-20 |
公开(公告)号: | CN109783808A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 张贺 | 申请(专利权)人: | 出门问问信息科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京睿派知识产权代理事务所(普通合伙) 11597 | 代理人: | 刘锋 |
地址: | 100190 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然语言理解模块 修正 统计模型 语法规则 装置及电子设备 自然语言文本 补充 解析 人力资源 速度比较 人工的 更新 | ||
本发明提供了一种修正自然语言理解模块的方法、装置及电子设备,用于解决现有技术中采用人工的方式修正自然语言理解模块中的语法规则和统计模型浪费人力资源,修正速度比较低的问题。包括:获取自然语言理解模块解析错误的自然语言文本;根据所述解析错误的自然语言文本确定补充语法规则和补充统计模型;根据所述补充语法规则和补充统计模型分别对所述自然语言理解模块进行修正,确定更新后的自然语言理解模块。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种修正自然语言理解模块的方法、装置及电子设备。
背景技术
随着互联网应用的发展,任务型人机对话系统(Task Oriented Spoken DialogueSystem,TOSDS)的应用越来越广泛,在TOSDS中一般包括语音识别模块,自然语言理解(Natural Language Understanding,NLU)模块,对话管理模块,自然语言生成模块,和语音合成模块,其中,上述自然语言理解模块用于对语音识别模块输出的自然语言文本进行语义解析,即将非结构化的自然语言文本解析为符合自然语言理解协议的结构化知识。通过自然语言理解模块对自然语言文本进行语义解析时,经常会出现解析错误,具体的,自然语言理解错误实例包括垂直领域分类错误,领域意图分类错误和语义槽标注错误三种类型,例如,垂直领域分类错误指自然语言文本应该属于垂直领域A,但是被自然语言理解模块划分到垂直领域B;领域意图分类错误指自然语言文本应该属于领域意图C但是被自然语言理解模块划分到领域意图D;语义槽标注错误指自然语言理解模块未能正确的标注自然语言文本中的语义槽。
为了减少自然语言理解模块解析错误的自然语言理解错误实例,需要对自然语言理解模块进行修正,提高自然语言理解模块对自然语言文本进行语义解析时的准确性,现有技术中,根据自然语言理解错误实例采用人工的方式修正自然语言理解模块中的语法规则和统计模型,以提高自然语言理解模块对自然语言文本进行语义进行解析时的准确性。但采用人工的方式修正自然语言理解模块中的语法规则和统计模型不仅浪费人力资源,同时修正速度也比较低。
综上所述,如何修正自然语言理解模块中的语法规则和统计模型,才能减少人力资源浪费,提高修正速度是目前需要解决的问题。
发明内容
有鉴于此,本发明提供了一种修正自然语言理解模块的方法、装置及电子设备,用于解决现有技术中采用人工的方式修正自然语言理解模块中的语法规则和统计模型浪费人力资源,修正速度比较低的问题。
根据本发明实施例的第一个方面,提供了一种修正自然语言理解模块的方法,包括:获取自然语言理解模块解析错误的自然语言文本;根据所述解析错误的自然语言文本确定补充语法规则和补充统计模型;根据所述补充语法规则和补充统计模型分别对所述自然语言理解模块进行修正,确定更新后的自然语言理解模块。
在一个实施例中,所述根据所述解析错误的自然语言文本确定补充语法规则和补充统计模型,具体包括:根据所述解析错误的自然语言文本生成具有预定方式的补充语法规则;根据所述补充语法规则,确定所述补充统计模型。
在一个实施例中,所述预设方式为正则表达式。
在一个实施例中,所述根据所述补充语法规则,确定所述补充统计模型,具体包括:响应于相同垂直领域下的所述补充语法规则的数量达到设定阈值,将所述达到设定阈值的所述补充语法规则添加到训练所述补充统计模型的训练集合;基于预定算法根据所述训练集合训练获取所述补充统计模型,其中,所述预定算法为最大熵算法、支持向量机算法或者神经网络算法。
在一个实施例中,所述训练集合中还包括通过领域知识库对模板进行扩展后确定的训练数据,其中,所述模板根据所述解析错误的自然语言文本以及所述解析错误的自然语言文本对应的正确的解析结果确定的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于出门问问信息科技有限公司,未经出门问问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811577608.5/2.html,转载请声明来源钻瓜专利网。