[发明专利]一种基于语义的物流智能客服问题相似度计算方法有效
| 申请号: | 201911079916.X | 申请日: | 2019-11-07 |
| 公开(公告)号: | CN111259655B | 公开(公告)日: | 2023-07-18 |
| 发明(设计)人: | 彭俊杰;胡敬响;胡淼;张换香;谭书华 | 申请(专利权)人: | 上海大学 |
| 主分类号: | G06F40/242 | 分类号: | G06F40/242;G06F40/247;G06F40/30;G06Q30/01 |
| 代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 何文欣 |
| 地址: | 200444*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 语义 物流 智能 客服 问题 相似 计算方法 | ||
1.一种基于语义的物流智能客服问题相似度计算方法,其特征在于操作步骤如下:
1)构建专业词典、同义词典和语义特征词典;
2)获得待判断语义相似度的两句话的词、词性和每种词性对应的词列表s1、s2,POS,SPOS1、SPOS2,并初始化两句话的语义向量sim1,sim2;遍历其中一句话的词列表s1,获得当前词w1i,同时遍历另外一句话的词列表s2,获得另外一句话的词列表中与当前词具有相同词性的词w2j;
3)更新当前位置的语义向量值sim1i,若w1i与w2j相同,则对应位置sim1i的值置为1.0;若不同,则判断是否具有同义关系;利用结合了物流领域的同义词典S,判断当前词对是否具有严格的同义关系;若在该同义词典中没有找到当前词对,则使用Word2Vec模型,获得两个词之间的相似度wsim,若相似度大于指定阈值t,则认为二者是同义词,相应的位置仍置为1.0;若小于指定的阈值t,则相应的位置置为该词对之间的相似度wsim;
4)同样的方式获得sim2;
5)在遍历两句话词表的过程中,分别得出语句对的语义特征词集合Q1={q11,q12,…,q1n},Q2={q21,q22,…,q2m};判断该语句对是否具有相同或相似的语义特征词,从Q1和Q2中去除相同或相似的语义特征词;若Q1与Q2均不为空,则对两句话的语义向量进行更新,扩大二者之间的语义距离,即两句话表达的意思是不相同;
6)计算sim1和sim2的余弦值,根据阈值判断两个句子是否具有语义相似;
获取词性、指定词性的词集合的计算公式如下所示:
其中,pi(i=1,2…f)是来自s1和s2的所有词性集合,prsij(r=1,2…min(k,l),i=1,2,j=1,2…min(m,n))代表第i句话,属于第r的词性的第j个词集合;k,l分别为两句话中的词性种类数;
选取下一个单词公式为:
对于任意一个属于某个词性的词集合pks1i的词w1i,需要从prs2j中选择词w2j,即选择第二句话中与w1i具有相同词性pr的词;w2(j+1)代表第二句话中的下一个词;
选取了当前对比词对之后,需要更新对应位置的语义向量值sim1i,计算公式如下:
首先,使用同义词典S去判断w1i和w2j是否具有同义关系,如果在S中没有找到这两个词,则使用Word2vec计算二者的相似度wsim,根据阈值t去判断二者的关系;
检查语义特征词集合,在遍历两句话的词表的过程中,得到语义特征词集合为:Q1={q11,q12,…,q1n},Q2={q21,q22,…,q2m};去除集合中相同或相似的语义特征词,并更新语义向量,计算公式如下所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911079916.X/1.html,转载请声明来源钻瓜专利网。





