[发明专利]商品领域的知识融合方法在审
申请号: | 201710117723.3 | 申请日: | 2017-03-01 |
公开(公告)号: | CN108536664A | 公开(公告)日: | 2018-09-14 |
发明(设计)人: | 杨静;潘栋 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30;G06Q30/06 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 臧云霄;夏彬 |
地址: | 200333 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种商品领域的知识融合方法,其中包括获取待处理的商品数据;采用Word2Vector方法将各个属性映射成具有多个维度的词向量;根据属性中属性值的词向量距离计算每两个属性之间的相似度;将相似度高于预设阈值的两个属性融合为同一类属性,得到属性融合后的商品数据集合。本发明提供了一种知识融合效果更好的知识融合方法,抓取了大量的商品数据进行训练,在对商品属性进行融合时,一方面大大减少了未登录词的出现,另一方面即使各别的属性值不存在,不会影响到该方法的运行,因此比传统的利用外部知识库的方法更加具有实用性;本方法不仅适用于电商领域的商品知识融合,也适用于其他领域的商品知识融合,从而提供基于知识的更好的服务。 | ||
搜索关键词: | 知识融合 商品数据 融合 商品领域 商品知识 词向量 相似度 知识库 抓取 距离计算 商品属性 属性映射 传统的 维度 预设 登录 集合 外部 服务 | ||
【主权项】:
1.一种商品领域的知识融合方法,其特征在于,包括如下步骤:获取待处理的商品数据,所述商品数据包括商品的属性和各个所述属性所对应的属性值;采用Word2Vector方法将各个所述属性映射成具有多个维度的词向量,各个所述词向量与所对应的属性中的各个属性值一一对应;根据每两个属性中属性值的词向量距离计算每两个属性之间的相似度;将相似度高于预设阈值的两个属性融合为同一类属性,得到属性融合后的商品数据集合。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710117723.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种数据标注方法及装置
- 下一篇:一种短文本信息提取方法和装置