[发明专利]自动问答方法、装置、可读存储介质及电子设备有效
| 申请号: | 202011165913.0 | 申请日: | 2020-10-27 |
| 公开(公告)号: | CN112182195B | 公开(公告)日: | 2022-12-27 |
| 发明(设计)人: | 苏萌;刘译璟;高体伟;左云鹏;易显维;苏海波 | 申请(专利权)人: | 北京百分点科技集团股份有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/28;G06F16/338 |
| 代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 贾会玲 |
| 地址: | 100096 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 自动 问答 方法 装置 可读 存储 介质 电子设备 | ||
1.一种自动问答方法,其特征在于,包括:
响应于接收到用户输入的问答语句,确定所述问答语句的问答类型信息,其中,所述问答类型信息包括问答跳数和所述问答语句的查询结构,所述查询结构包括链式结构和夹式结构;
获取所述问答语句中的实体;
根据所述问答语句、所述实体和所述问答语句的问答类型信息,确定与所述问答语句匹配的目标回答语句;
所述响应于接收到用户输入的问答语句,确定所述问答语句的问答类型,包括:
将所述问答语句输入至问答分类模型,得到所述问答分类模型输出的表征所述问答类型信息的序列编码向量;
所述问答分类模型通过以下方式训练得到:
获取样本问答语句,以及所述样本问答语句对应的查询语句;
根据预设数值所表征的含义,对所述查询语句进行编码,以得到表征所述样本问答语句的问答类型信息的样本序列编码向量;
将所述样本问答语句作为模型输入参数,将所述样本序列编码向量作为模型输出参数,对神经网络模型进行训练,以得到所述问答分类模型;
在所述根据预设数值所表征的含义,对所述查询语句进行编码之前,还包括:
根据所述样本问答语句的实际跳数和预设的跳数阈值,扩充所述查询语句,以使扩充后的所述查询语句包括的总跳数等于所述跳数阈值;
相应地,所述根据预设数值所表征的含义,对所述查询语句进行编码,包括:
针对扩充后的所述查询语句中的每一跳,按照主语、谓语和宾语划分三个槽位,并根据预设数值中各数值所表征的含义,确定每一槽位对应的数值,以得到所述样本序列编码向量。
2.根据权利要求1所述的方法,其特征在于,所述预设数值包括用于表征在所述样本问答语句中存在但不问的第一数值、用于表征问的第二数值、用于表征中间结果但不问的第三数值、以及用于表征不存在所述样本问答语句中的第四数值;
其中,在扩充的每一跳的各槽位对应的数值均为第四数值。
3.根据权利要求1所述的方法,其特征在于,所述根据所述问答语句、所述实体和所述问答语句的问答类型信息,确定与所述问答语句匹配的目标回答语句,包括:
将所述问答语句、所述实体和所述问答语句的问答类型信息,输入至关系预测模型,得到所述关系预测模型输出的预测关系;
根据所述预测关系,利用Cypher查询语句在知识库中确定与所述问答语句匹配的目标回答语句。
4.根据权利要求3所述的方法,其特征在于,所述问答类型信息包括的问答跳数为n,n为大于或等于2的整数,且所述查询结构为夹式结构;所述将所述问答语句、所述实体和所述问答语句的问答类型信息,输入至关系预测模型,得到所述关系预测模型输出的预测关系,包括:
将所述问答语句、每一所述实体和所述问答语句的问答类型信息,输入至关系预测模型,以得到所述关系预测模型输出的每一所述实体对应的预测关系;
所述根据所述预测关系,利用Cypher查询语句在知识库中确定与所述问答语句匹配的目标回答语句,包括:
根据每一实体对应的预测关系,利用Cypher查询语句在知识库中确定与多个所述预测关系各自对应的回答语句;
对多个所述回答语句进行求交集运算得到与所述问答语句匹配的目标回答语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百分点科技集团股份有限公司,未经北京百分点科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011165913.0/1.html,转载请声明来源钻瓜专利网。





