[发明专利]三嵌入卷积神经网络模型及其文本多分类方法在审
申请号: | 201910200666.4 | 申请日: | 2019-03-17 |
公开(公告)号: | CN110046250A | 公开(公告)日: | 2019-07-23 |
发明(设计)人: | 朱定局;田娟;欧珠 | 申请(专利权)人: | 华南师范大学;西藏民族大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F17/27;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510631 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于文本分类技术领域,涉及一种词、词性和词长三嵌入卷积神经网络模型及其文本多分类方法。词、词性和词长三嵌入卷积神经网络模型,包括依次相连的输入层、查找表、卷积层、特征池化层、特征连接层、特征选择层和分类输出层,同时采用新词识别方法识别中文新词,从而提高了分词的精确度和文本分类的准确率。 | ||
搜索关键词: | 卷积神经网络 嵌入 文本分类 词性 分类 文本 方法识别 特征选择 新词识别 依次相连 查找表 连接层 输出层 输入层 特征池 准确率 分词 化层 卷积 中文 | ||
【主权项】:
1.一种词、词性和词长三嵌入卷积神经网络模型,其特征在于,包括依次相连的输入层、查找表、卷积层、特征池化层、特征连接层、特征选择层和分类输出层,其中:输入层:用于接收预处理后的文本,进行词向量编码,得到词特征向量映射矩阵、词性特征向量映射矩阵和词长特征向量映射矩阵;查找表:用于存储词特征向量映射矩阵、词性特征向量映射矩阵和词长特征向量映射矩阵,包括词查找表、词性查找表和词长查找表;卷积层:用于通过查找表获得需要处理的词矩阵、词性矩阵和词长矩阵,对获得的词矩阵、词性矩阵和词长矩阵进行卷积运算,得到词、词性和词长局部特征;特征池化层:用于对词、词性和词长局部特征进行降维处理;特征连接层:用于对降维处理后的词、词性和词长局部特征进行合并处理,得到融合特征矩阵;在进行合并处理时对词、词性和词长局部特征赋予不同的预设权值进行融合;特征选择层:用于对融合特征矩阵采用dropout机制,随机删除部分特征,得到分类器输入矩阵;分类输出层:用于将分类器输入矩阵作为输入,对特征进行分析,完成文本多分类;其中,确定所述预设权值的步骤包括:取多组不同的预设权值;利用由不同的预设权值形成的连接操作层构成的所述词、词性和词长三嵌入卷积神经网络模型进行文本分类的测试;根据测试计算得到由不同的预设权值形成的连接操作层构成的所述词、词性和词长三嵌入卷积神经网络模型对应的分类准确度;取分类准确度最高的所述词、词性和词长三嵌入卷积神经网络模型对应的预设权值作为连接操作层的所述预设权值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学;西藏民族大学,未经华南师范大学;西藏民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910200666.4/,转载请声明来源钻瓜专利网。