[发明专利]融合事实文本的知识库问答方法有效
| 申请号: | 202011056492.8 | 申请日: | 2020-09-30 |
| 公开(公告)号: | CN112256847B | 公开(公告)日: | 2023-04-07 |
| 发明(设计)人: | 余正涛;王广祥;郭军军;相艳;黄于欣;线岩团 | 申请(专利权)人: | 昆明理工大学 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F40/205;G06F40/295;G06F40/30;G06N3/0464;G06N3/0442;G06N3/08 |
| 代理公司: | 昆明人从众知识产权代理有限公司 53204 | 代理人: | 何娇 |
| 地址: | 650093 云*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 融合 事实 文本 知识库 问答 方法 | ||
1.融合事实文本的知识库问答方法,其特征在于,所述方法包括:
Step1、主题实体识别;
Step2、候选答案检索:根据主题实体在知识库Freebase中检索候选答案;
Step3、事实文本生成:将每个候选答案转换成可进行文本表示的事实文本;
Step4、知识库问答模型构建:采用BERT将自然语言问题和候选答案表示成数值向量,计算向量间的相似度得分并选出得分最高的候选作为最终答案;
所述步骤Step2根据识别出来的主题实体从知识库中查找满足约束条件的事实作为候选答案;
所述约束条件为:如果知识库中三元组的头实体属于问题的主题实体,就将该三元组列为候选答案;
所述步骤Step3中,将得到的候选答案对应的三元组中的实体、实体关系及类型通过模式“疑问词+尾实体类型+关系+头实体”构建成一个事实文本。
2.根据权利要求1所述的融合事实文本的知识库问答方法,其特征在于:所述步骤Step1中,采用基于双向长短记忆网络BiLSTM的模型来执行主题实体识别任务,使用预先训练好的Glove模型将单词映射成词向量并经过BiLSTM、全连接层以及Softmax得到该单词是否是主题实体单词的概率。
3.根据权利要求1所述的融合事实文本的知识库问答方法,其特征在于:所述步骤Step4中选用一种多层双向Transformer编码器——BERT分别对自然语言问题及Step3生成的事实文本进行表示学习得到对应的向量表示,然后使用余弦相似度对问题与事实文本的向量表示进行相似度计算作为候选答案的分数,对分数进行数值排序,分数最高的候选答案就是最终答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011056492.8/1.html,转载请声明来源钻瓜专利网。





