[发明专利]一种基于语义的物流智能客服问题相似度计算方法有效

专利信息
申请号: 201911079916.X 申请日: 2019-11-07
公开(公告)号: CN111259655B 公开(公告)日: 2023-07-18
发明(设计)人: 彭俊杰;胡敬响;胡淼;张换香;谭书华 申请(专利权)人: 上海大学
主分类号: G06F40/242 分类号: G06F40/242;G06F40/247;G06F40/30;G06Q30/01
代理公司: 上海上大专利事务所(普通合伙) 31205 代理人: 何文欣
地址: 200444*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 语义 物流 智能 客服 问题 相似 计算方法
【权利要求书】:

1.一种基于语义的物流智能客服问题相似度计算方法,其特征在于操作步骤如下:

1)构建专业词典、同义词典和语义特征词典;

2)获得待判断语义相似度的两句话的词、词性和每种词性对应的词列表s1、s2,POS,SPOS1、SPOS2,并初始化两句话的语义向量sim1,sim2;遍历其中一句话的词列表s1,获得当前词w1i,同时遍历另外一句话的词列表s2,获得另外一句话的词列表中与当前词具有相同词性的词w2j

3)更新当前位置的语义向量值sim1i,若w1i与w2j相同,则对应位置sim1i的值置为1.0;若不同,则判断是否具有同义关系;利用结合了物流领域的同义词典S,判断当前词对是否具有严格的同义关系;若在该同义词典中没有找到当前词对,则使用Word2Vec模型,获得两个词之间的相似度wsim,若相似度大于指定阈值t,则认为二者是同义词,相应的位置仍置为1.0;若小于指定的阈值t,则相应的位置置为该词对之间的相似度wsim

4)同样的方式获得sim2

5)在遍历两句话词表的过程中,分别得出语句对的语义特征词集合Q1={q11,q12,…,q1n},Q2={q21,q22,…,q2m};判断该语句对是否具有相同或相似的语义特征词,从Q1和Q2中去除相同或相似的语义特征词;若Q1与Q2均不为空,则对两句话的语义向量进行更新,扩大二者之间的语义距离,即两句话表达的意思是不相同;

6)计算sim1和sim2的余弦值,根据阈值判断两个句子是否具有语义相似;

获取词性、指定词性的词集合的计算公式如下所示:

其中,pi(i=1,2…f)是来自s1和s2的所有词性集合,prsij(r=1,2…min(k,l),i=1,2,j=1,2…min(m,n))代表第i句话,属于第r的词性的第j个词集合;k,l分别为两句话中的词性种类数;

选取下一个单词公式为:

对于任意一个属于某个词性的词集合pks1i的词w1i,需要从prs2j中选择词w2j,即选择第二句话中与w1i具有相同词性pr的词;w2(j+1)代表第二句话中的下一个词;

选取了当前对比词对之后,需要更新对应位置的语义向量值sim1i,计算公式如下:

首先,使用同义词典S去判断w1i和w2j是否具有同义关系,如果在S中没有找到这两个词,则使用Word2vec计算二者的相似度wsim,根据阈值t去判断二者的关系;

检查语义特征词集合,在遍历两句话的词表的过程中,得到语义特征词集合为:Q1={q11,q12,…,q1n},Q2={q21,q22,…,q2m};去除集合中相同或相似的语义特征词,并更新语义向量,计算公式如下所示:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911079916.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top