[发明专利]一种可解释的文本推断方法有效
申请号: | 202110743722.6 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113590745B | 公开(公告)日: | 2023-10-10 |
发明(设计)人: | 万海;沈大伟;刘亚男;曾娟;黄佳莉 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06N3/0442;G06N3/08;G06N5/04 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 刘俊 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 可解释 文本 推断 方法 | ||
1.一种可解释的文本推断方法,其特征在于,包括以下步骤:
S1:进行指代消解、实体识别;
S2:进行信息编码;
S3:构建句子关系图;
S4:句子关系图的处理;
S5:进行特征信息融合;
S6:进行选项选择。
2.根据权利要求1所述的可解释的文本推断方法,其特征在于,所述步骤S1的具体过程是:
S11:对于背景材料中的所有句子,使用StandfordCoreNLP工具进行指代消解,并将指代消解后的句子替换背景材料中的原始句子;
S12:对背景材料中的所有句子按顺序进行编号,对于有N个句子的背景材料,得到编号为为s0至sN-1的句子序号表示,同时对问题句子编号为q;
S13:对于背景材料的所有句子和问题句子,使用StandfordCoreNLP工具进行实体抽取,然后构建句子实体表;句子实体表中,第一列为句子序号,即q以及s0至sN-1,第二列为句子序号所对应句子中所含有的实体集合。
3.根据权利要求2所述的可解释的文本推断方法,其特征在于,所述步骤S2的具体过程是:
S21:由背景材料句子s0,s1,…sN-1,问题句子q和选项句子o0,o1,o2,o3,组成示例的句子集合,通过预训练语言模型产生每个句子的特征表示;
S22:令预训练语言模型的输入句子为s,由n个单词构成,在单词序列的头部加入“[CLS]”,尾部加入“[SEP]”,得到预训练语言模型的输入序列;
S23:预训练语言模型采用Bert模型,输入序列经过Bert模型,抽取“[CLS]”所对应的隐含特征向量,作为句子s的特征表示,记为vs。
4.根据权利要求3所述的可解释的文本推断方法,其特征在于,所述步骤S3的具体过程是:
S31:将背景材料中所有句子的特征表示和问题句子的特征表示作为句子关系图的节点,即句子特征vs0,vs1,…,vsN-1和句子特征vq,则句子关系图共有N+1个节点;
S32:构建句子关系图中各个节点间的初始边关系矩阵M,具体为:初始阶段,任意两个节点间的边权重均为0,实际上,边关系矩阵为一个二维矩阵,每个维度表示图的节点,则矩阵大小为R(N+1)×(N+1),其中,第i个节点和第j个节点的边权重为M[i][j];
S33:构建句子关系图中节点间边关系矩阵M的顺序关系,具体为:对于背景材料中的句子节点vs0,vs1,…,vsN-1,假设vsi和vsi+1所对应的句子在同一段落中,且这两个句子相邻,则对应边权重做加2处理,即M[i][i+1]=M[i][i+1]+2;如果vsi和vsi+1所对应的句子不在同一段落中,但这两个句子相邻,则对应边权重做加1处理,即M[i][i+1]=M[i][i+1]+1;
S34:构建句子关系图中节点间边关系矩阵的内容相关关系,根据步骤S1中得到的句子实体表D,将具有相同实体的句子节点的边权重做加3处理:句子i的实体集合为D[i],句子j的实体集合为D[j],若则M[i][j]=M[i][j]+3。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110743722.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大规模类别层级文本分类方法
- 下一篇:一种钼精粉混料设备及其方法