[发明专利]引入农业领域知识的抽取式智能问答方法及系统在审
| 申请号: | 202011529017.8 | 申请日: | 2020-12-22 |
| 公开(公告)号: | CN112527999A | 公开(公告)日: | 2021-03-19 |
| 发明(设计)人: | 任妮;沈耕宇;郭婷;鲍彤;刘家祥;王坚强 | 申请(专利权)人: | 江苏省农业科学院 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/289 |
| 代理公司: | 北京博雅睿泉专利代理事务所(特殊普通合伙) 11442 | 代理人: | 蔡兴兵 |
| 地址: | 210014 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 引入 农业 领域 知识 抽取 智能 问答 方法 系统 | ||
1.一种引入农业领域知识的抽取式智能问答方法,其特征在于,包括以下步骤:
S1、获取技术文章,构建基于所述技术文章的文档资源库;
S2、针对用户提出的问题,检索所述文档资源库中与所述问题相关的关联文档,并构建问题文章组合对数据;
S3、根据所述问题文章组合对数据进行问句与文章预训练语言模型Bert编码,得到编码后的隐藏层编码向量,并将所述隐藏层编码向量作为所述问题文章组合对数据的初始编码;
S4、构建知识图谱数据,将所述知识图谱数据嵌入Bert模型,获得知识表示向量,并将所述知识表示向量与所述初始编码合并后输出问句与文章编码向量;
S5、将所述问句与文章编码向量进行自注意力交互层运算,得到自注意力交互向量,并将所述问句与文章编码向量与所述自注意力交互向量进行拼接,得到拼接后的关系向量;
S6、将拼接后的所述关系向量作为答案预测层的输入向量,进行答案位置的预测,并将答案输出给用户。
2.根据权利要求1中所述的引入农业领域知识的抽取式智能问答方法,其特征在于,所述步骤S2包括以下子步骤:
S21、对用户提出问题的问题文本进行分词处理和去除停用词处理;
S22、根据处理后的所述问题文本,检索所述文档资源库,并得到与所述问题文本相关的关联文档;
S23、根据所述关联文档与所述问题文本的相关度对所述关联文档排序,构建所述问题文章组合对数据,并形成问题文章排序组合对。
3.根据权利要求2中所述的引入农业领域知识的抽取式智能问答方法,其特征在于,所述步骤S3包括以下子步骤:
S31、将所述问题文章组合对数据拆分成可输入到Bert模型中的符合输入文本序列长度限制的段落,并与问句组合拼接形成输入序列;
S32、将拼接后的所述问题文章组合对数据的输入序列经过向量化的转换后,输入到Bert模型中进行编码模块处理;
S33、经所述编码模块处理后输出,并经过Transformer框架编码后的隐藏层编码向量作为问题文章段落组合的输入序列的初始编码。
4.根据权利要求3所述的引入农业领域知识的抽取式智能问答方法,其特征在于,所述步骤S4包括:
S41、基于深度学习的实体关系抽取技术,将知识图谱以知识三元组的形式存储,构建成所述知识图谱数据;
S42、对所述知识图谱数据进行训练,将知识图谱中的实体和关系数据转换为稠密低维的分布式表示向量;
S43、对所述问题文章组合对数据进行实体识别,获得与实体对应的知识表示向量;
S44、将所述知识表示向量与Bert模型输出的所述隐藏层编码向量合并,并将合并后的向量输入到Bert模型中编码运算,得到所述问句与文章编码向量。
5.根据权利要求1所述的引入农业领域知识的抽取式智能问答方法,其特征在于,在所述自注意力交互层运算中,所述问题文章组合对数据中任意两个实体的交互矩阵的计算公式为:
Rij=WT[ui,uj,ui⊙uj]
其中,i和j分别表示所述问题文章组合对数据中的两个命名实体,ui和uj分别表示所述知识图谱数据嵌入Bert模型后获得的相应知识表示向量,Rij表示矩阵R中第i行第j列的值,WT表示参数矩阵。
6.根据权利要求5所述的引入农业领域知识的抽取式智能问答方法,其特征在于,所述矩阵R的每一行执行softmax函数计算得到矩阵A,得到所述矩阵A的计算公式为:
其中,aij是矩阵A中的第i行和第j列的值,rij是矩阵R中第i行和第j列的值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏省农业科学院,未经江苏省农业科学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011529017.8/1.html,转载请声明来源钻瓜专利网。





