[发明专利]一种语义相似度计算方法、装置、电子设备及存储介质在审
申请号: | 202110579152.1 | 申请日: | 2021-05-26 |
公开(公告)号: | CN113312462A | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 吕超;韩佳;史祎凡;高峰;刘谦;姚雷;王建辉;杜新凯 | 申请(专利权)人: | 阳光保险集团股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F40/289;G06N3/04 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 余菲 |
地址: | 518000 广东省深圳市福田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语义 相似 计算方法 装置 电子设备 存储 介质 | ||
1.一种语义相似度计算方法,其特征在于,包括:
获取第一语句与第二语句;所述第一语句与所述第二语句中均包括至少一个句子;
根据所述第一语句,确定所述第一语句包括的至少一个第一关键词,以及根据所述第二语句,确定所述第二语句包括的至少一个第二关键词;所述第一关键词是指所述第一语句中除指定词语之外的其他词语,所述第二关键词是指所述第二语句中除指定词语之外的其他词语;
对于每个所述第一关键词,确定该第一关键词对应的第一词向量;以及对于每个所述第二关键词,确定该第二关键词对应的第二词向量;
将所有的所述第一词向量输入到第一时间卷积网络中,输出用于表示所述第一语句的语义的第一向量;以及将所有的所述第二词向量输入到第二时间卷积网络中,输出用于表示所述第二语句的语义的第二向量;其中所述第一时间卷积网络与所述第二时间卷积网络通过孪生神经网络共享参数;
根据所述第一向量与所述第二向量,计算所述第一语句与所述第二语句之间的语义相似度。
2.根据权利要求1所述的语义相似度计算方法,其特征在于,所述根据所述第一语句,确定所述第一语句包括的至少一个第一关键词,包括:
删除所述第一语句中的停用词;
对删除停用词后的所述第一语句进行分词处理,得到所述第一语句包括的至少一个第一关键词;
根据所述第二语句,确定所述第二语句包括的至少一个第二关键词,包括:
删除所述第二语句中的停用词;
对删除停用词后的所述第二语句进行分词处理,得到所述第二语句包括的至少一个第二关键词。
3.根据权利要求1所述的语义相似度计算方法,其特征在于,所述对于每个所述第一关键词,确定该第一关键词对应的第一词向量,包括:
对于每个所述第一关键词,从预先定义的词典中,匹配出与该第一关键词对应的第一词向量;所述预先定义的词典中存储有所述第一关键词与所述第一词向量之间的对应关系;
所述对于每个所述第二关键词,确定该第二关键词对应的第二词向量,包括:
对于每个所述第二关键词,从所述预先定义的词典中,匹配出与该第二关键词对应的第二词向量;所述预先定义的词典中存储有所述第二关键词与所述第二词向量之间的对应关系。
4.根据权利要求1所述的语义相似度计算方法,其特征在于,所述将所有的所述第一词向量输入到第一时间卷积网络中,输出用于表示所述第一语句的语义的第一向量,包括:
按照所述第一关键词在所述第一语句中的先后顺序,将所述第一词向量进行组合,得到所述第一语句对应的第一词向量序列;
将所述第一词向量序列输入到第一时间卷积网络中,输出用于表示所述第一语句的语义的第一向量;
所述将所有的所述第二词向量输入到第二时间卷积网络中,输出用于表示所述第二语句的语义的第二向量,包括:
按照所述第二关键词在所述第二语句中的先后顺序,将所述第二词向量进行组合,得到所述第二语句对应的第二词向量序列;
将所述第二词向量序列输入到第二时间卷积网络中,输出用于表示所述第二语句的语义的第二向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阳光保险集团股份有限公司,未经阳光保险集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110579152.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种游戏界面显示的方法、装置、设备及介质
- 下一篇:一种往复式车身侧顶装置