[发明专利]单用户智慧图谱的构建方法有效
申请号: | 201610962361.3 | 申请日: | 2016-10-28 |
公开(公告)号: | CN106997371B | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 乔小燕;张玮;金彤;唐志燕;杨弢;刘晓敏;袁媛 | 申请(专利权)人: | 华数传媒网络有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 杭州天昊专利代理事务所(特殊普通合伙) 33283 | 代理人: | 董世博 |
地址: | 310000 浙江省杭州市滨*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了单用户智慧图谱的构建方法,包括获取用户特征集数据、数据标准化、层次聚类、语料库分类、确定变量的类别归属、确定最终9类特征集的顺序步骤;单用户智慧图谱的构建方法,打破了行业障碍主观选择带来的标签分类,避免由于主观选择而导致标签的冗余。 | ||
搜索关键词: | 单用户 智慧 图谱 构建 方法 | ||
【主权项】:
单用户智慧图谱的构建方法,其特征在于,包括如下步骤:101,获取用户特征集数据,数据来源于用户日全量表、产品订购信息表、受理记录表、设备订购信息表、资源基本信息表、点播详单表、客户日全量表、流失预测表、暂停预测表、呼叫中心日志表、直播数据表等数据表中,形成用户特征集F={f1,f2,…,fk},所述f1至fk均为用户的各个数据的表;102,数据标准化,在步骤101之后,对数据进行标准化处理;103,层次聚类,在步骤102之后,将标准化的数据变量进行层次聚类,将K个变量所属的类别集合为Cluster={ct1,ct2,…,ct9},所述ct1至ct9为层次聚类后剩下的9个特征的表;104,语料库分类,在步骤102之后,将标准化的数据变量进行语料库分类,将K个变量所属的类别集合为Classfier={cf1,cf2,…,cf9},所述cf1至cf9为语料库分类后剩下的9个特征的表;105,确定变量的类别归属,使用RelieF方法分别计算步骤103和104的所得类别集合,用RelieF方法对每一个变量归属于Cluster={ct1,ct2,…,ct9},Classfier={cf1,cf2,…,cf9}的权重进行计算,选择权重较大的特征作为原始变量最终的类别归属集合C={c1,c2,…,c9},所述c1‑c9为最终类别剩下的9个特征的表;106,确定最终9类特征集,对步骤105的最终的类别归属集合C={c1,c2,…,c9},再次进行使用RelieF方法,获得每一类别中的特征权重,并按照规则进行C1至C9内特征删减。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华数传媒网络有限公司,未经华数传媒网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610962361.3/,转载请声明来源钻瓜专利网。