[发明专利]一种面向新兴技术预测的佐证事实的抽取方法及系统有效
申请号: | 202010102001.2 | 申请日: | 2020-02-19 |
公开(公告)号: | CN111325036B | 公开(公告)日: | 2023-10-13 |
发明(设计)人: | 毛彬;罗准辰;郑安庆;罗威;谭玉珊;田昌海;叶宇铭;宋宇;吴叔義 | 申请(专利权)人: | 中国人民解放军军事科学院军事科学信息研究中心 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/295;G06F40/169;G06F16/335 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 陈琳琳;刘振 |
地址: | 100142*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 新兴 技术 预测 佐证 事实 抽取 方法 系统 | ||
本发明公开了一种面向新兴技术预测的佐证事实的抽取方法及系统,所述方法包括:针对新兴技术构造一条辅助声明,构建佐证数据的语料文档集;进行关键词匹配,得到候选文档集合;计算候选文档集合中每个文档和辅助声明的语义匹配系数和语义相关系数,根据语义匹配系数进行阈值过滤,根据语义相关系数进行排序,获得K个最相关文档;对K个最相关文档的所有句子构建句子集,计算每个句子和辅助声明的语义匹配系数和语义相关系数,根据语义匹配系数进行阈值过滤,根据语义相关系数进行排序,获得L条佐证句子;根据四个特征维度进行特征提取,获取每个句子的特征表示;将L条佐证句子和特征表示输入训练好的排序模型,输出经过排序的结果句子集。
技术领域
本发明涉及计算机语言学领域,尤其涉及计算机自然语言处理领域,特别涉及一种面向新兴技术预测的佐证事实的抽取方法及系统。
背景技术
新兴技术预测对于企业和政府具有重要战略意义,尤其在制定技术投资策略和战略布局方面。然而作为一个研究领域,对于如何识别和判定技术是否属于新兴技术在学术界和产业界还没有形成统一的共识。现在大多数尝试都致力于研究和开发预测系统,然而对于系统的输出结果缺乏可解释性。相比于预测新兴技术,尤其是预测准确性和可信度尚不可知的系统和方法,提供一种可应用于新兴技术预测的证据抽取方法更具有可行性。
NSMN:Neural Semantic Matching Network(神经语义匹配网络),由四层组成,具体为:
1、编码层,是一个双向-长短期记忆网络(Bidirectional LSTM),对输入句子的每一个词进行编码,设两个输入序列为则
其中d0,d1为改层输入和输出表示维度,n,m为两个输入序列的词长。
2、对准层,获得两个输入序列对准后的表示。首先生成一个对准矩阵eij表示两个输入序列的每两个词之间的对准度;然后通过将一个输入序列的词与另一个输入序列根据标准化对准系数做加权和得到,得到相应的对准表示,
其中,Softmaxcol表示按列的softmax函数;最后用对准表示和编码表示组合作为最终的对准表示
其中f是一个由一个整流器作为激活函数的映射层,表示点乘。
3、匹配层,是一个循环神经网络,即
其中U*,V*表示额外添加两个输入序列的向量表示。
4、输出层,首先将匹配层得到的P,Q通过最大池化函数映射成向量p,q,即
然后将p,q,|p-q|,作为输入通过一个由两层整流器的映射层组成的神经网络得到最后的输出向量
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军军事科学院军事科学信息研究中心,未经中国人民解放军军事科学院军事科学信息研究中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010102001.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种家教机数据的分析管理方法及装置
- 下一篇:可疑组织发现系统和方法