[发明专利]一种基于对话系统的回答数据生成方法以及相关装置在审
申请号: | 201711422050.9 | 申请日: | 2017-12-25 |
公开(公告)号: | CN108009287A | 公开(公告)日: | 2018-05-08 |
发明(设计)人: | 何朋;罗欢;权圣 | 申请(专利权)人: | 北京中关村科金技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N99/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 100025 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 对话 系统 回答 数据 生成 方法 以及 相关 装置 | ||
1.一种基于对话系统的回答数据生成方法,其特征在于,包括:
对获取的已知意图对话数据根据已知的意图进行规则构建处理,得到分类规则集;其中,所述已知意图对话数据为经过分析识别热点事件得到的;
判断接收的对话数据是否符合所述分类规则集的识别条件;
若所述对话数据符合所述识别条件,则利用所述分类规则集对所述对话数据进行识别得到意图识别结果;
若所述对话数据不符合所述识别条件,则利用分类模型对所述对话数据进行识别得到意图识别结果;
根据所述意图识别结果生成所述对话数据对应的回答数据。
2.根据权利要求1所述的回答数据生成方法,其特征在于,对获取的已知意图对话数据根据已知的意图进行规则构建处理,得到分类规则集,包括:
获取所述已知意图对话数据;
根据所述已知意图对话数据进行决策树构建处理,得到决策树;
对所述决策树进行规则提取操作,得到多条分类规则;
对所有所述分类规则进行测试,根据测试结果进行筛选,将所有筛选通过的分类规则作为分类规则集。
3.根据权利要求2所述的回答数据生成方法,其特征在于,对所述决策树进行规则提取操作,得到多条分类规则,包括:
记录从所述决策树的根节点到每个叶子节点经过的节点和路径;
以每个所述叶子节点对应的路径和节点作为一条分类规则对所有路径和所有节点进行处理,得到多条所述分类规则。
4.根据权利要求3所述的回答数据生成方法,其特征在于,对所有所述分类规则进行测试,根据测试结果进行筛选,将所有筛选通过的分类规则作为分类规则集,包括:
对每条分类规则通过预设的测试集进行测试,得到所述测试结果;
根据所述测试结果判断对应的分类规则是否符合预设要求;
若是,则将所述分类规则加入所述分类规则集。
5.根据权利要求1所述的回答数据生成方法,其特征在于,判断接收的对话数据是否符合所述分类规则集的识别条件,包括:
接收用户输入的所述对话数据;
将所述对话数据按照预设规则进行抽取处理,得到特征数据;
根据所述特征数据判断所述对话数据是否符合所述识别条件。
6.一种基于对话系统的回答数据生成装置,其特征在于,包括:
分类规则获取模块,用于对获取的已知意图对话数据根据已知的意图进行规则构建处理,得到分类规则集;其中,所述已知意图对话数据为经过分析识别热点事件得到的;
条件判断模块,用于判断接收的对话数据是否符合所述分类规则集的识别条件;
规则识别模块,用于利用所述分类规则集对所述对话数据进行识别得到意图识别结果;
模型识别模块,用于利用分类模型对所述对话数据进行识别得到意图识别结果;
应答模块,用于根据所述意图识别结果生成所述对话数据对应的回答数据。
7.根据权利要求6所述的回答数据生成装置,其特征在于,所述分类规则获取模块,包括:
标注数据获取单元,用于获取所述已知意图对话数据;
决策树构建单元,用于根据所述已知意图对话数据进行决策树构建处理,得到决策树;
规则提取单元,用于对所述决策树进行规则提取操作,得到多条分类规则;
规则测试单元,用于对所有所述分类规则进行测试,根据测试结果进行筛选,将所有筛选通过的分类规则作为分类规则集。
8.根据权利要求7所述的回答数据生成装置,其特征在于,所述条件判断模块,包括:
对话数据接收单元,用于接收用户输入的所述对话数据;
特征抽取单元,用于将所述对话数据按照预设规则进行抽取处理,得到特征数据;
判断单元,用于根据所述特征数据判断所述对话数据是否符合所述识别条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中关村科金技术有限公司,未经北京中关村科金技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711422050.9/1.html,转载请声明来源钻瓜专利网。