[发明专利]一种数据处理方法及其装置有效

专利信息
申请号: 201611101349.X 申请日: 2016-12-02
公开(公告)号: CN108153754B 公开(公告)日: 2021-09-14
发明(设计)人: 范正洁;熊龙 申请(专利权)人: 中国移动通信有限公司研究院;中国移动通信集团公司
主分类号: G06F16/31 分类号: G06F16/31
代理公司: 北京派特恩知识产权代理有限公司 11270 代理人: 蒋雅洁;李梅香
地址: 100053 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据处理 方法 及其 装置
【说明书】:

发明实施例公开了一种数据处理方法,所述方法包括:获取基准标签树和待融合标签树;从所述待融合标签树中选取出待融合标签,从所述基准标签树中选取出与所述待融合标签对应的基准标签;获取所述待融合标签的标签特征,和与所述待融合标签具有关联关系的至少一个上一级标签的标签特征;以及,获取所述基准标签的标签特征,和与所述基准标签具有关联关系的至少一个上一级标签的标签特征;基于标签特征,将所述待融合标签与所述基准标签进行匹配,并至少基于匹配结果确定出所述待融合标签插入到所述基准标签树中的合并位置,以便于将所述待融合标签树与所述基准标签树进行合并处理。本发明实施例还公开了一种数据处理装置。

技术领域

本发明涉及数据处理技术,尤其涉及一种数据处理方法及其装置。

背景技术

随着大数据技术的深入研究与应用,企业的专注点日益聚焦于怎样利用大数据来为精准营销服务,进而深入挖掘潜在的商业价值。于是,“用户画像”的概念也就应运而生。用户画像,即用户信息标签化。企业通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息之后,抽象出一个用户的商业全貌,得到用户画像,这是企业应用大数据技术的基本方式。用户画像为企业提供了重要的信息基础,能够帮助企业快速、精准地找到用户群体以及确定用户需求等更信息。构建用户画像的核心工作即是给用户贴“标签”,其中标签是通过对用户信息分析而来的高度精炼的特征标识。利用标签来表示用户兴趣的优势在于不仅能反映用户行为特征,表明用户的兴趣偏好,还能反映用户兴趣偏好资源的语义特征。因此,构建能够用来准确化描述一系列不同用户行为的标签体系是用户画像技术的基础和核心技术。

目前用于刻画用户行为的标签生成方法有:

第一,专家经验,根据经验知识,人工设定标签体系,以刻画用户行为;但是,该方式中需要有丰富的经验、渊博的知识、对用户数据有充分了解的专家,否则经验知识得到的标签无法准确的描述用户行为;

第二,主题学习模型,直接利用用户数据例如用户访问的网页的文本信息,通过主题学习模型(例如LDA)获得一系列主题,并将该一系列主题作为固定的标签体系来刻画用户行为;但是,此方式生成的标签粒度比较粗,比如女装,若想在女装中进一步细化出“裙装”、“外套”时,此方法则无法实现,且当用户的数据发生变化或者增加时,需要在保证原本的标签不变的情况下重新利用主题模型更新标签,更新一次标签消耗的计算资源较大;

第三,非统一的标签,最直接的方法,不是固定一些标签,将用户行为归类于这些标签下,而是直接利用从用户数据例如用户访问网页的文本信息中提取出的描述词语(例如关键词)等来刻画用户行为。此方式,由于没有固定的标签描述用户行为,即没有统一的标签体系,所以,会对管理用户行为造成困难,当需要找某一类行为的用户时,如果使用统一的标签体系,则只需要找包含特定的几个标签的用户即可,但是如果没有统一的标签体系,则无法确定筛选的条件,寻找符合条件的用户会很困难;并且分析用户行为时,由于没有统一的标签体系,很难准确定位用户的行为或者类型。

发明内容

为解决现有存在的技术问题,本发明实施例提供了一种数据处理方法及其装置,能至少解决现有技术中存在的上述问题。

本发明实施例的技术方案是这样实现的:

本发明实施例第一方面提供了一种数据处理方法,所述方法包括:

获取基准标签树和待融合标签树;

从所述待融合标签树中选取出待融合标签,从所述基准标签树中选取出与所述待融合标签对应的基准标签;

获取所述待融合标签的标签特征,和与所述待融合标签具有关联关系的至少一个上一级标签的标签特征;以及,获取所述基准标签的标签特征,和与所述基准标签具有关联关系的至少一个上一级标签的标签特征;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信有限公司研究院;中国移动通信集团公司,未经中国移动通信有限公司研究院;中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611101349.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top