[发明专利]三嵌入卷积神经网络模型及其文本多分类方法在审

专利信息
申请号: 201910200666.4 申请日: 2019-03-17
公开(公告)号: CN110046250A 公开(公告)日: 2019-07-23
发明(设计)人: 朱定局;田娟;欧珠 申请(专利权)人: 华南师范大学;西藏民族大学
主分类号: G06F16/35 分类号: G06F16/35;G06F16/33;G06F17/27;G06N3/04
代理公司: 暂无信息 代理人: 暂无信息
地址: 510631 广东省*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明属于文本分类技术领域,涉及一种词、词性和词长三嵌入卷积神经网络模型及其文本多分类方法。词、词性和词长三嵌入卷积神经网络模型,包括依次相连的输入层、查找表、卷积层、特征池化层、特征连接层、特征选择层和分类输出层,同时采用新词识别方法识别中文新词,从而提高了分词的精确度和文本分类的准确率。
搜索关键词: 卷积神经网络 嵌入 文本分类 词性 分类 文本 方法识别 特征选择 新词识别 依次相连 查找表 连接层 输出层 输入层 特征池 准确率 分词 化层 卷积 中文
【主权项】:
1.一种词、词性和词长三嵌入卷积神经网络模型,其特征在于,包括依次相连的输入层、查找表、卷积层、特征池化层、特征连接层、特征选择层和分类输出层,其中:输入层:用于接收预处理后的文本,进行词向量编码,得到词特征向量映射矩阵、词性特征向量映射矩阵和词长特征向量映射矩阵;查找表:用于存储词特征向量映射矩阵、词性特征向量映射矩阵和词长特征向量映射矩阵,包括词查找表、词性查找表和词长查找表;卷积层:用于通过查找表获得需要处理的词矩阵、词性矩阵和词长矩阵,对获得的词矩阵、词性矩阵和词长矩阵进行卷积运算,得到词、词性和词长局部特征;特征池化层:用于对词、词性和词长局部特征进行降维处理;特征连接层:用于对降维处理后的词、词性和词长局部特征进行合并处理,得到融合特征矩阵;在进行合并处理时对词、词性和词长局部特征赋予不同的预设权值进行融合;特征选择层:用于对融合特征矩阵采用dropout机制,随机删除部分特征,得到分类器输入矩阵;分类输出层:用于将分类器输入矩阵作为输入,对特征进行分析,完成文本多分类;其中,确定所述预设权值的步骤包括:取多组不同的预设权值;利用由不同的预设权值形成的连接操作层构成的所述词、词性和词长三嵌入卷积神经网络模型进行文本分类的测试;根据测试计算得到由不同的预设权值形成的连接操作层构成的所述词、词性和词长三嵌入卷积神经网络模型对应的分类准确度;取分类准确度最高的所述词、词性和词长三嵌入卷积神经网络模型对应的预设权值作为连接操作层的所述预设权值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学;西藏民族大学,未经华南师范大学;西藏民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910200666.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top