[发明专利]用于优化标签库的方法、装置、电子设备和介质在审
申请号: | 201911403325.3 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111177123A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 于博杰;王永生 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06F16/21 | 分类号: | G06F16/21 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 李成龙 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 优化 标签 方法 装置 电子设备 介质 | ||
本公开提供了一种用于优化标签库的方法,包括获得标签库,所述标签库包括多个用于反映对象的特征的标签,确定多个所述标签中的每个标签的数据价值和业务价值,其中,所述数据价值基于生成所述标签的数据表确定,所述业务价值基于所述标签的历史访问数据确定,基于所述数据价值和业务价值,确定所述标签的综合价值,以及基于所述综合价值,从所述标签库中移除部分标签,得到目标标签库。本公开提供了一种电子设备、一种用于优化标签库的装置以及一种计算机可读存储介质。
技术领域
本公开涉及一种用于优化标签库的方法、装置、电子设备和介质。
背景技术
当前用户画像领域将更多的眼光专注在从深度和广度上扩展标签体系,因此用户画像系统的标签数量每月以较快的速度增加。业务对于标签的需求也各有见解,不断有新标签需求接踵而至。随着时间推移,业务的重点的调整,有些标签价值在慢慢减弱。如此,造成标签库变得越来越臃肿,有价值的标签得不到更好地利用。
发明内容
本公开的一个方面提供了一种用于优化标签库的方法,包括获得标签库,所述标签库包括多个用于反映对象的特征的标签,确定多个所述标签中的每个标签的数据价值和业务价值,其中,所述数据价值基于生成所述标签的数据表确定,所述业务价值基于所述标签的历史访问数据确定,基于所述数据价值和业务价值,确定所述标签的综合价值,以及基于所述综合价值,从所述标签库中移除部分标签,得到目标标签库。
可选地,确定多个所述标签中的每个标签的数据价值进一步包括基于生成所述标签的数据表以及生成所述标签的方式,确定所述标签的初始权重,基于多个标签之间的逻辑关系图,修正所述初始权重,得到每个标签的数据价值。
可选地,所述基于多个标签之间的逻辑关系图,修正所述初始权重,得到每个标签的数据价值进一步包括获得多个标签之间的逻辑关系图,所述逻辑关系图为有向无环图,对于处于逻辑关系图中作为节点的标签,根据所述节点的入度确定每个来源的贡献值,以及基于所述贡献值和所述初始权重,确定所述标签的数据价值。
可选地,确定多个所述标签中的每个标签的业务价值进一步包括获得多个所述标签中的每个标签的历史访问次数,最后访问时间以及调用方的数量,基于所述历史访问次数,最后访问时间以及调用方的数量确定标签的业务价值。
可选地,所述方法还包括通过标签的访问量验证所述标签的综合价值。
可选地,所述通过标签的访问量验证所述标签的综合价值包括获得标签访问量,将所述标签访问量和标签的综合价值分别归一化,按照标签访问量和标签的综合价值分别统计在多个区间中的标签的数量,基于所述数量,确定标签访问量和标签的综合价值之间的差异,在所述差异小于阈值时,确定所述标签的综合价值通过验证。
可选地,所述确定多个所述标签中的每个标签的数据价值和业务价值,包括基于第一参数集合确定多个所述标签中的每个标签的数据价值和业务价值,所述基于所述数据价值和业务价值,确定所述标签的综合价值包括基于所述数据价值、业务价值以及第二参数集合确定所述标签的综合价值,所述方法还包括在所述差异不小于阈值时,调整所述第一参数集合和第二参数集合中的至少一个参数的值,以及基于调整后的第一参数集合和第二参数集合,重新确定所述标签的综合价值。
本公开的另一方面提供了一种用于优化标签库的装置,包括获得模块、第一确定模块、第二确定模块以及优化模块。获得模块,用于获得标签库,所述标签库包括多个用于反映对象的特征的标签。第一确定模块,用于确定多个所述标签中的每个标签的数据价值和业务价值,其中,所述数据价值基于生成所述标签的数据表确定,所述业务价值基于所述标签的历史访问数据确定。第二确定模块,用于基于所述数据价值和业务价值,确定所述标签的综合价值。优化模块,用于基于所述综合价值,从所述标签库中移除部分标签,得到目标标签库。
本公开的另一个方面提供了一种电子设备,包括处理器以及存储器。存储器上存储有计算机可读指令,所述指令被处理器执行时用于实现如上所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911403325.3/2.html,转载请声明来源钻瓜专利网。