[发明专利]一种隐含语篇关系的分类方法有效
申请号: | 202110843643.2 | 申请日: | 2021-07-26 |
公开(公告)号: | CN113590821B | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 刘杰;马宇昊;周建设;张凯;张磊 | 申请(专利权)人: | 北方工业大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/211;G06F40/30;G06N3/0464;G06N3/08 |
代理公司: | 北京挺立专利事务所(普通合伙) 11265 | 代理人: | 蔡宗慧 |
地址: | 100144 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 隐含 关系 分类 方法 | ||
1.一种隐含语篇关系的分类方法,其特征在于,包括:
S1、针对待分类的第一语篇信息和第二语篇信息,基于隐式语篇关系分类模型,获取第一语篇信息和第二语篇信息中语义信息的语义交互图结构;
所述语义交互图结构中的句内边表示句法依赖关系,交互边表示第一语篇信息的节点和第二语篇信息的节点在当前句子对中具有的语义关联关系,节点为语篇信息的单词;
S2、针对所述语义交互图结构,获取与第一语篇信息和第二语篇信息对应的语义特征;
S3、将获取的语义特征借助于指数映射投影到双曲空间中,获取所述第一语篇信息和第二语篇信息的分类结果;
其中,所述隐式语篇关系分类模型为预先建立并训练的包括有上下文表示层、语义学习层、卷积层、聚合层和预测层的模型;
所述上下文表示层、语义学习层执行获取语义交互图结构的过程,所述语义学习层、卷积层和所述聚合层执行获取语义特征的过程,所述预测层执行获取分类结果的过程;
S1具体包括:
所述隐式语篇关系分类模型的上下文表示层针对待分类的第一语篇信息和第二语篇信息提取与第一语篇信息对应的第一语篇信息表示向量组和与第二语篇信息对应的第二语篇信息表示向量组;
其中,所述第一语篇信息表示向量组包括分别与所述第一语篇信息中的单词一一对应的具有上下文特征的编码向量;所述第二语篇信息表示向量组包括分别与所述第二语篇信息中的单词一一对应的具有上下文特征的编码向量;
所述隐式语篇关系分类模型的语义学习层基于第一语篇信息表示向量组和第二语篇信息表示向量组,采用预先设定的构图策略构建语义交互图结构;
所述隐式语篇关系分类模型的上下文表示层针对待分类的第一语篇信息和第二语篇信息提取与第一语篇信息对应的第一语篇信息表示向量组和与第二语篇信息对应的第二语篇信息表示向量组,具体包括:
所述隐式语篇关系分类模型的上下文表示层采用预先设定的BERT模型分别对第一语篇信息和第二语篇信息进行处理,获取与第一语篇信息对应的第一单元组arg1和与第二语篇信息对应的第二单元组arg2;
其中,所述第一单元组arg1为:
所述第二单元组arg2为:
M是arg1的长度;且M为预先设定的;
N是arg2的长度;且N为预先设定的;
是Argi中第kth个单词的token;
CLS和EOS分别是BERT模型中的嵌入的token;
将所述第一单元组arg1和所述第二单元组arg2进行拼接,获取第三单元组;
所述第三单元组为:
SEP是标明语篇单元连接边界的嵌入标记;
所述BERT模型中的编码器对所述第三单元组进行处理,获取与第一语篇信息和第二语篇信息对应的向量组;
所述与第一语篇信息和第二语篇信息对应的向量组为:
[h0,h1,...,hM+N+2,hM+N+3];
hn表示第三单元组中第n个token或嵌入标记所对应的具有上下文特征的编码向量;
基于第一语篇信息和第二语篇信息对应的向量组,获取与第一语篇信息对应的第一语篇信息表示向量组和与第二语篇信息对应的第二语篇信息表示向量组;
其中,所述第一语篇信息表示向量组为:[h0,h1,...,hM+1];
所述第二语篇信息表示向量组为:[hM+2,hM+3,...,hM+N+3];
所述隐式语篇关系分类模型的语义学习层基于第一语篇信息表示向量组和第二语篇信息表示向量组,采用预先设定的构图策略构建语义交互图结构,具体包括:
所述隐式语篇关系分类模型的语义学习层采用Standford CoreNLP解析器分别针对第一语篇信息表示向量组和第二语篇信息表示向量组进行句法分析,分别获取所述第一语篇信息的依存结构信息和第二语篇信息的依存结构信息;
所述第一语篇信息的依存结构信息包括:第一语篇信息中单词的词性信息以及各单词之间的句法依赖关系;
所述第二语篇信息的依存结构信息包括:第二语篇信息中单词的词性信息以及各单词之间的句法依赖关系;
分别基于所述第一语篇信息的依存结构信息和第二语篇信息的依存结构信息,分别获取第一语篇信息的句法关系图和第二语篇信息的句法关系图;
每一句法关系图中以相应语篇单元中的单词和词性作为节点,以相应语篇单元中单词和单词之间的句法依赖关系作为图中的节点之间的句内边;
基于第一语篇信息的句法关系图和第二语篇信息的句法关系图,构造语义交互图结构;
所述语义交互图结构包括第一语篇信息的句法关系图和第二语篇信息的句法关系图以及交互边;
所述交互边为在所述第一语篇信息中的任一单词和第二语篇信息中的任一单词之间满足预设条件的单词之间的边;
所述预设条件为:表示单词之间语义关联关系的共现频率低于预先设定值;
所述单词之间的共现频率为B(arg1i,arg2j);
其中,
B(arg1i,arg2j)是单词对(arg1i,arg2j)的共现频率;
其中,arg1i为arg1中的第i个token所对应的单词;
arg2i为arg2中的第j个token所对应的单词;
p(arg1i,arg2j)是arg1i和arg2j在预先设定的PDTB2.0语料库中统计的一起出现的频率;
p(arg1i)是arg1t在预先设定的PDTB2.0语料库中单独出现的频率;
p(arg2j)是arg2j在预先设定的PDTB2.0语料库中单独出现的频率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北方工业大学,未经北方工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110843643.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:运用栅格舵的微小型无人机及控制方法
- 下一篇:一种汽车仪表板的卡接结构