[发明专利]一种基于CNN的中文关系分类方法及系统在审
申请号: | 201910928313.6 | 申请日: | 2019-09-28 |
公开(公告)号: | CN110750642A | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 王德庆;张辉;田润琦;郝瑞 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06N3/08;G06N3/04 |
代理公司: | 11381 北京汲智翼成知识产权代理事务所(普通合伙) | 代理人: | 陈曦;贾兴昌 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 矩阵 句子 注意力机制 输入矩阵 特征向量 词向量 语义 分类效果 关键词语 关系分类 关系类型 距离向量 连接层 卷积 加权 拼接 主流 概率 中文 | ||
本发明公开了一种基于CNN的中文关系分类方法及系统,其中该方法包括如下步骤:将句子的词向量矩阵、实体距离向量矩阵,以及通过注意力机制加权的词向量矩阵进行拼接得到CNN的输入矩阵;将输入矩阵输入到CNN的卷积层,得到句子的特征向量;将句子的特征向量输入CNN的全连接层,得到每个关系类型的概率。该方法在目前主流模型的基础上,加入了基于语义依存路径的注意力机制,使得可以对于句子中表达具体关系的关键词语更加关注,分类效果得到很大的提升。
技术领域
本发明涉及一种基于CNN的中文关系分类方法,同时涉及一种实现该方法的系统。
背景技术
随着大数据,人工智能等技术得到了广泛的应用,知识图谱也成为了当今计算机领域的热门研究方向。知识图谱的建立,可以使很多智能系统的准确程度得到显著的提升。在科技搜索引擎中,可以实现一个功能模块。当用户输入一个实体词语,以图的形式显示出与该词语存在特定关系的词语。比如,输入“流行性感冒”,可以得到治疗感冒的药物“清开灵注射液”等信息。
关系分类技术是实现该功能模块的关键技术。关系分类的研究对于自然语言处理的研究有着十分重大的意义。
在互联网日益发达的今天,非结构化的文本在大数据的时代中是最容易获得的资源,但是,如何从非结构化文本中获取知识信息,是一个非常值得研究的问题。关系分类的研究在于抽取句子中两个实体的语义关系,可以把非结构化的文本中的信息,以结构化的关系三元组的形式表示。比如“可口可乐是一种碳酸饮料”,就可抽取出(describe,可口可乐,碳酸饮料),从而明白,可口可乐与碳酸饮料之间是一种描述关系。如果有准确度极高的关系分类模型,我们就可以通过互联网上大量的非结构化文本,获取大量结构化的知识,从而可以构建知识图谱,提升诸如医疗、新闻等领域的智能化程度。
实体关系的抽取技术经历了从传统机器学习方法,到深度神经网络的发展过程。随着计算机计算能力的高速发展,深度学习的技术也成为了人工智能领域的主流技术,而深度学习也为关系分类的研究提供了新的思路。神经网络模型可以学习到高层次的语义特征,这一过程完全是通过数学运算达到数学上的最优解,对人为设计的依赖相对降低了。但是,还是需要人的参与,去设计需要提取的特征,比如语法、词向量等能表达句子语义的特征,去指导神经网络模型学习高层次的语义特征。
目前,各种语音助手,聊天机器人等技术越来越火热,关系分类技术的研究具有十分良好的前景和需求。
发明内容
针对现有技术的不足,本发明所要解决的首要技术问题在于提供一种基于CNN的中文关系分类方法。
本发明所要解决的另一技术问题提供一种基于CNN的中文关系分类系统。
为实现上述发明目的,本发明采用下述的技术方案:
根据本发明实施例的第一方面,提供一种基于CNN的中文关系分类方法,包括如下步骤:
将句子的词向量矩阵、实体距离向量矩阵,以及通过注意力机制加权的词向量矩阵进行拼接得到CNN的输入矩阵;
将输入矩阵输入到CNN的卷积层,得到句子的特征向量;
将句子的特征向量输入CNN的全连接层,得到每个关系类型的概率。
其中较优地,将句子的词向量矩阵、实体距离向量矩阵,以及通过注意力机制加权的词向量矩阵进行拼接得到CNN的输入矩阵,包括如下步骤:
将标注好实体的句子进行分词,得到词语序列;并将词语序列转化成词向量矩阵;
计算句子中每个词语分别到两个实体距离的实体距离向量PF1和PF2,将得到的实体距离向量进行拼接,构成实体距离向量矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910928313.6/2.html,转载请声明来源钻瓜专利网。