[发明专利]一种文本语义匹配的方法及装置有效
申请号: | 201810031623.3 | 申请日: | 2018-01-12 |
公开(公告)号: | CN108132931B | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 蒋宏飞;赵红红;晋耀红;杨凯程 | 申请(专利权)人: | 鼎富智能科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
地址: | 230000 安徽省合肥市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供一种文本语义匹配方法,该方法使用由待处理文本中词和字对应的词向量和字向量获得总向量,再对所述总向量进行卷积处理、平均化处理以及双向LSTM处理,其中,在处理基础文本时采用不具有注意力机制的LSTM方法,而处理目标文本时,采用具有注意力机制的LSTM方法,分别获得池化向量,再用两个池化向量的相似度作为两篇文本的相似度,该方法不仅考虑了文本中词之间的语义联系,还考虑了字之间的语义联系,不仅考虑了字、词之间正向的语义联系,还考虑了字、词之间反向的语义联系,并且综合应用了多种文本匹配模型,使文本上下文之间的特征信息表达得更为全面、准确和充分,增加了文本匹配的准确度。 | ||
搜索关键词: | 一种 文本 语义 匹配 方法 装置 | ||
【主权项】:
一种文本语义匹配的方法,其特征在于,包括:获取基础文本中的基础词和基础字符,所述基础文本包括至少一个基础词,每个基础词包括至少一个基础字符;根据所述基础词和基础字符获取基础输入向量;对所述基础输入向量进行卷积处理,获得至少一个基础局部信息向量;根据所述基础局部信息向量获取基础局部信息平均向量;对所述基础局部信息平均向量进行不具有注意力机制的双向LSTM处理,得到基础池化向量;获取目标文本中的目标词和目标字符,所述目标文本包括至少一个目标词,每个目标词包括至少一个目标字符;根据所述目标词和目标字符获取目标输入向量;对所述目标输入向量进行卷积处理,获得至少一个目标局部信息向量;根据所述目标局部信息向量获取目标局部信息平均向量;使用所述基础池化向量对所述目标局部信息平均向量进行具有注意力机制的双向LSTM处理,获得目标池化向量;计算所述基础池化向量和所述目标池化向量的相似度;如果所述相似度大于或者等于预设值,则确定所述目标文本的语义与所述基础文本的语义匹配。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鼎富智能科技有限公司,未经鼎富智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810031623.3/,转载请声明来源钻瓜专利网。
- 上一篇:特征词提取方法及装置
- 下一篇:带有复制机制的神经机器翻译方法