[发明专利]一种基于CNN的中文关系分类方法及系统在审

专利信息
申请号: 201910928313.6 申请日: 2019-09-28
公开(公告)号: CN110750642A 公开(公告)日: 2020-02-04
发明(设计)人: 王德庆;张辉;田润琦;郝瑞 申请(专利权)人: 北京航空航天大学
主分类号: G06F16/35 分类号: G06F16/35;G06F16/33;G06N3/08;G06N3/04
代理公司: 11381 北京汲智翼成知识产权代理事务所(普通合伙) 代理人: 陈曦;贾兴昌
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 矩阵 句子 注意力机制 输入矩阵 特征向量 词向量 语义 分类效果 关键词语 关系分类 关系类型 距离向量 连接层 卷积 加权 拼接 主流 概率 中文
【说明书】:

发明公开了一种基于CNN的中文关系分类方法及系统,其中该方法包括如下步骤:将句子的词向量矩阵、实体距离向量矩阵,以及通过注意力机制加权的词向量矩阵进行拼接得到CNN的输入矩阵;将输入矩阵输入到CNN的卷积层,得到句子的特征向量;将句子的特征向量输入CNN的全连接层,得到每个关系类型的概率。该方法在目前主流模型的基础上,加入了基于语义依存路径的注意力机制,使得可以对于句子中表达具体关系的关键词语更加关注,分类效果得到很大的提升。

技术领域

本发明涉及一种基于CNN的中文关系分类方法,同时涉及一种实现该方法的系统。

背景技术

随着大数据,人工智能等技术得到了广泛的应用,知识图谱也成为了当今计算机领域的热门研究方向。知识图谱的建立,可以使很多智能系统的准确程度得到显著的提升。在科技搜索引擎中,可以实现一个功能模块。当用户输入一个实体词语,以图的形式显示出与该词语存在特定关系的词语。比如,输入“流行性感冒”,可以得到治疗感冒的药物“清开灵注射液”等信息。

关系分类技术是实现该功能模块的关键技术。关系分类的研究对于自然语言处理的研究有着十分重大的意义。

在互联网日益发达的今天,非结构化的文本在大数据的时代中是最容易获得的资源,但是,如何从非结构化文本中获取知识信息,是一个非常值得研究的问题。关系分类的研究在于抽取句子中两个实体的语义关系,可以把非结构化的文本中的信息,以结构化的关系三元组的形式表示。比如“可口可乐是一种碳酸饮料”,就可抽取出(describe,可口可乐,碳酸饮料),从而明白,可口可乐与碳酸饮料之间是一种描述关系。如果有准确度极高的关系分类模型,我们就可以通过互联网上大量的非结构化文本,获取大量结构化的知识,从而可以构建知识图谱,提升诸如医疗、新闻等领域的智能化程度。

实体关系的抽取技术经历了从传统机器学习方法,到深度神经网络的发展过程。随着计算机计算能力的高速发展,深度学习的技术也成为了人工智能领域的主流技术,而深度学习也为关系分类的研究提供了新的思路。神经网络模型可以学习到高层次的语义特征,这一过程完全是通过数学运算达到数学上的最优解,对人为设计的依赖相对降低了。但是,还是需要人的参与,去设计需要提取的特征,比如语法、词向量等能表达句子语义的特征,去指导神经网络模型学习高层次的语义特征。

目前,各种语音助手,聊天机器人等技术越来越火热,关系分类技术的研究具有十分良好的前景和需求。

发明内容

针对现有技术的不足,本发明所要解决的首要技术问题在于提供一种基于CNN的中文关系分类方法。

本发明所要解决的另一技术问题提供一种基于CNN的中文关系分类系统。

为实现上述发明目的,本发明采用下述的技术方案:

根据本发明实施例的第一方面,提供一种基于CNN的中文关系分类方法,包括如下步骤:

将句子的词向量矩阵、实体距离向量矩阵,以及通过注意力机制加权的词向量矩阵进行拼接得到CNN的输入矩阵;

将输入矩阵输入到CNN的卷积层,得到句子的特征向量;

将句子的特征向量输入CNN的全连接层,得到每个关系类型的概率。

其中较优地,将句子的词向量矩阵、实体距离向量矩阵,以及通过注意力机制加权的词向量矩阵进行拼接得到CNN的输入矩阵,包括如下步骤:

将标注好实体的句子进行分词,得到词语序列;并将词语序列转化成词向量矩阵;

计算句子中每个词语分别到两个实体距离的实体距离向量PF1和PF2,将得到的实体距离向量进行拼接,构成实体距离向量矩阵;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910928313.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top