[发明专利]问题解析方法、装置、电子设备及存储介质在审
申请号: | 202011305368.0 | 申请日: | 2020-11-19 |
公开(公告)号: | CN112380343A | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 张师琲 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06F16/338;G06F16/335;G06F16/33;G06F40/30 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问题 解析 方法 装置 电子设备 存储 介质 | ||
本发明涉及人工智能技术,揭露了一种问题解析方法,包括:利用原始问题集及预先设定的语句分类模板训练得到问题分发模型及语义抽取模型,利用所述问题分发模型对待解析问题进行分类,得到分类结果,利用所述语义抽取模型对所述待解析问题进行语义解析,得到语义解析结果,根据所述分类结果以及所述语义解析结果查找相匹配的查询语句模板,根据所述查询语句模板得到问题查询语句,并利用所述问题查询语句查询数据库内容,得到问答解析结果并提交给查询终端。此外,本发明还涉及区块链技术,所述问答解析结果可存储于区块链的节点。本发明还提出一种问题解析装置、电子设备以及计算机可读存储介质。本发明可以解决问题解析效率低下的问题。
技术领域
本发明涉及人工智能技术,尤其涉及一种问题解析方法、装置、电子设备及计算机可读存储介质。
背景技术
问题解析模型是尝试对用户问题进行意图分析和答案匹配的模型。当前的问题解析模型主要有两种实施方式:一种是通过TF-IDF算法提炼关键词,组成文本向量,再对其进行分类的方式;另一种采用机器学习的方式训练多个分类模型。虽然这两种方式都可达到对用户问题进行意图分析和答案匹配的目的,但有以下缺陷:1、通过TF-IDF算法的方式,对某些客户问题较为简短的场景,存在分类准确率和精度都不是特别高的问题;2、通过训练多个分类模型的方式,模型分类较多且需要花大量时间调整模型参数和结构,因此存在问题解析效率低下的问题。
发明内容
本发明提供一种问题解析方法、装置及计算机可读存储介质,其主要目的在于解决问题解析效率低下的问题。
为实现上述目的,本发明提供的一种问题解析方法,包括:
获取原始问题集,利用所述原始问题集以及预先设定的语句分类模板训练预构建的第一语言模型,得到问题分发模型;及利用所述原始问题集训练预构建的第二语言模型,得到语义抽取模型;
利用所述问题分发模型对待解析问题进行分类,得到分类结果;及利用所述语义抽取模型对所述待解析问题进行语义解析,得到语义解析结果;
根据所述分类结果以及所述语义解析结果查找相匹配的查询语句模板,根据所述查询语句模板得到问题查询语句;
利用所述问题查询语句查询数据库内容,得到问答解析结果并反馈给查询终端。
可选地,所述利用所述原始问题集训练预构建的第二语言模型,得到语义抽取模型,包括:
利用所述第二语言模型提取所述原始问题集中的实体信息,并根据所述实体信息预测与所述实体信息对应的实体和实体关系;
计算所述实体信息预测的准确率;
当所述预测的准确率高于预设的阈值时,生成所述训练完成的语义抽取模型。
可选地,所述计算所述实体信息预测的准确率,包括:
采用下述公式计算所述准确率L:
er,s为真正有关系的实体,er,c为预测的有关系的实体,R为所有实体个数,r为第r个实体。
可选地,所述提取所述原始问题集中的实体信息,并根据所述实体信息预测与所述实体信息对应的实体和实体关系,包括:
将所述原始问题集转化为原始序列,并利用所述第二语言模型的编码器对所述原始序列进行编码,得到编码序列;
利用预设的二分类器预测所述编码序列中的实体信息;
从所述编码序列中抽取出所述实体信息首尾对应的编码向量;
以所述编码向量作为条件对所述编码序列做层标准化,对所述层标准化后的序列预测与所述实体信息对应的实体和实体关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011305368.0/2.html,转载请声明来源钻瓜专利网。