[发明专利]基于CNN卷积层和BiLSTM的中文短文本相关性度量方法有效
申请号: | 202010534862.8 | 申请日: | 2020-06-12 |
公开(公告)号: | CN111723572B | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 朱新华;吴晗;张兰芳;陈宏朝;郭青松 | 申请(专利权)人: | 广西师范大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06F16/33;G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 桂林市持衡专利商标事务所有限公司 45107 | 代理人: | 陈跃琳 |
地址: | 541004 广西壮*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于CNN卷积层和BiLSTM的中文短文本相关性度量方法,通过孪生神经网络作为框架,使用Word2vec训练的中文字向量作为输入,首先会经过去掉池化层的CNN提取到文本的n‑gram信息,用于模拟中文文本的分词过程;然后输入到BiLSTM网络中继续提取不同粒度的文本特征,更准确的对文本语义进行编码。最终将文本向量化,通过计算两个向量的距离来表示相关性。本发明采用去掉池化层的CNN提取文本的n‑gram信息,可有效避免池化层所造成的特征损失,在中文短文本的相关性度量上具有较好的准确性,且在计算效率上较快,不要求很高的配置。 | ||
搜索关键词: | 基于 cnn 卷积 bilstm 中文 文本 相关性 度量 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西师范大学,未经广西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010534862.8/,转载请声明来源钻瓜专利网。
- 上一篇:用于多种气体预先混合的腔体
- 下一篇:一种摄像头补光方法及终端、存储介质