[发明专利]一种在深度语言模型中融入额外知识信息的方法在审
申请号: | 202010410674.4 | 申请日: | 2020-05-15 |
公开(公告)号: | CN111666374A | 公开(公告)日: | 2020-09-15 |
发明(设计)人: | 杨燕;郑淇;陈成才;贺樑 | 申请(专利权)人: | 华东师范大学;上海智臻智能网络科技股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/35;G06F40/211;G06F40/295;G06F40/30 |
代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 语言 模型 融入 额外 知识 信息 方法 | ||
1.一种在深度语言模型中融入额外知识信息的方法,其特征在于采用将知识信息融入到深度语言模型中进行预训练的方法,用以强化和提升知识库问答系统中关系匹配模块的性能,模型的训练和知识融入包括以下具体步骤:
步骤一:构建实体到指称的词表
采用知识库或富含人工标注的超链接文本,构建实体指称到实体的词表;
步骤二:识别文本中的实体信息
利用构建的词表对自然语言文本进行标注,识别文本中的实体信息,并链接到知识库中所对应的实体中为训练正样本;
步骤三:创建训练所需的负样本
根据实体链接后所得到的结构化信息,对自然语言文本进行扰动,创建训练所需的负样本;
步骤四:预训练深度语言模型参数
使用创建的负样本为新训练集进行预训练深度语言模型参数,并对所获得的训练集对深度语言模型进行无监督预训练,以将知识信息融入到模型参数中强化其性能。
2.根据权利要求1所述在深度语言模型中融入额外知识信息的方法,其特征在于所述词表所涉及到的实体源于某一个知识库或含有结构化知识信息的文本。
3.根据权利要求1所述在深度语言模型中融入额外知识信息的方法,其特征在于所述自然语言文本进行标的文本来源于在互联网上自动爬取的文本。
4.根据权利要求1所述在深度语言模型中融入额外知识信息的方法,其特征在于所述新训练集由爬取的原语料以及扰动后所创建的负样本构成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学;上海智臻智能网络科技股份有限公司,未经华东师范大学;上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010410674.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种树叶状独立光伏供电系统
- 下一篇:诃子提取物在制备马拉色菌抑制剂中的应用