[发明专利]一种基于选择交互的样本知识聚合度计算方法、系统以及存储介质有效

专利信息
申请号: 202110126983.3 申请日: 2021-01-29
公开(公告)号: CN112948417B 公开(公告)日: 2023-01-13
发明(设计)人: 项涛;刘智勇;杨旭;曾少锋;姚志煜 申请(专利权)人: 上海维外科技有限公司
主分类号: G06F16/242 分类号: G06F16/242;G06F16/9535
代理公司: 上海天翔知识产权代理有限公司 31224 代理人: 刘常宝
地址: 200023 上海市黄浦区蒙自路20*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 选择 交互 样本 知识 聚合 计算方法 系统 以及 存储 介质
【说明书】:

发明公开了一种基于选择交互的样本知识聚合度计算方法、系统以及存储介质,本方案首先构建相应样本的选择交互向量,包括推送向量与点击向量,其中推送向量为被动选择向量,点击向量为主动选择的向量;然后基于不同样本的推送向量与点击向量,分别计算两个样本间的真实契合度与没有知识点重合时的先验契合度;最后通过度量两种契合度的提升程度,即可获得样本间知识聚合度。本方案能够在不使用样本本身内容的情况下,仅利用选择向量表示的选择交互数据,计算出样本间知识点或兴趣的聚合程度,在计算中排除样本流行程度的影响。

技术领域

本发明涉及互联网、人工智能领域中数据样本处理技术,具体涉及样本知识聚合度的计算技术。

背景技术

很多互联网任务中,存在大量选择交互,比如对某个网页的选择、对资讯的选择、及对商品的选择,由此可以产生大量的选择数据。从被选择的目标角度来看,选择数据可以整理成选择主体的集合,或者写成高维组合向量的形式,即维度为选择主体数目、元素值为0或1的高度稀疏向量。很多时候需要利用选择这种形式的选择数据计算被选择的目标间的相似度,比如通过两篇资讯的选择向量计算它们之间的相似度,该相似度可以进一步作为资讯推荐的依据,类似的,通过两件商品的选择向量计算它们之间的关联度也可用来推荐商品。

目前通常用于计算上述选择向量的方法包括皮尔逊相似性度量,余弦相似性度量与杰卡德相似性度量。在这些相似性度量方法中,杰卡德相似性度量方法尤其适合高度稀疏的高维组合选择向量,其核心思路是计算两个集合的交集规模在它们并集规模中的比例,对于选择向量来说则通过逻辑运算实现,通过分别对两个选择向量进行按位与和按位或操作,然后计算两种操作后结果1范数比值,其中1范数指向量中的非零元素个数。

众所周知在互联网应用中,很多时候要考虑选择数据样本间的本质内容的相似性,比如其涵盖的知识或兴趣的聚合程度,而包括杰卡德相似性度量在内的现有相似度计算方法通过对样本选择变量的统计获得,是一个绝对的数值,没有考虑样本自身的选择比例或流行程度,因此不能客观反映样本间知识点或兴趣的聚合程度或聚合价值。例如,对于两个被广泛选择的流行样本,即使它们包含的知识点或兴趣点完全不同(如资讯中的爆炸性新闻和抽奖新闻),利用现有相似性度量方法计算,这两个样本相似度也会得到一个很高的值,但它们的知识点或兴趣点聚合程度可能非常低。相反的,对于两个被较少选择的小众样本,即使他们包含的知识点或兴趣点高度一致,由于数据推送原因导致选择主体往往分布分散,利用现有相似性度量方法计算,这两个样本相似度反而会得到一个不高的值。如此,如何有效的利用选择数据度量样本间知识或兴趣等本质相似性为本领域亟需解决的问题。

发明内容

针对现有数据样本相似性度量计算方法所存在的问题,本发明的目的在于提供一种基于选择交互的样本知识聚合度计算方法,可以在不引入被选择目标本身内容信息的前提下,获得数据样本间本质的知识点或兴趣点的聚合程度。据此,本发明还进一步提供一种计算系统,以及存储介质。

为了达到上述目的,本发明提供的基于选择交互的样本知识聚合度计算方法,包括:

构建相应样本的选择交互向量,包括推送向量与点击向量,其中推送向量为被动选择向量,点击向量为主动选择的向量;

基于不同样本的推送向量与点击向量,分别计算两个样本间的真实契合度与没有知识点重合时的先验契合度;

通过度量真实契合度与先验契合度之间的提升程度,获得样本间知识聚合度。

进一步地,所述方法通过如下方式构建样本的选择交互向量:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海维外科技有限公司,未经上海维外科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110126983.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top