[发明专利]一种多约束条件下的个性化信息推荐方法及信息推荐系统有效
申请号: | 201710368933.X | 申请日: | 2017-05-23 |
公开(公告)号: | CN107256238B | 公开(公告)日: | 2019-12-17 |
发明(设计)人: | 王泳;杨志明 | 申请(专利权)人: | 深思考人工智能机器人科技(北京)有限公司 |
主分类号: | G06F16/2457 | 分类号: | G06F16/2457 |
代理公司: | 11472 北京方安思达知识产权代理有限公司 | 代理人: | 陈琳琳;杨青 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 约束 条件下 个性化 信息 推荐 方法 系统 | ||
1.一种多约束条件下的个性化信息推荐方法,其特征在于,包括:
步骤1)利用数据库中存储的所有物品信息构建元数据,对各种物品对应的元数据进行编码;
步骤2)根据元数据的编码数据对用户关联的物品数据进行数字编码为“1”,对用户未关联的物品数据进行数字编码为“0”,形成用户数据;
步骤3)以预设的若干种约束物品能够关联到同一用户为约束条件检索所有用户数据,如果能够检索出满足该约束条件的用户数据,则将所有满足约束条件的用户数据组成数据集,并执行步骤5),否则执行步骤4);
步骤4)将所有约束物品进行分组,在用户数据中根据分组分别进行聚类分析,寻找聚类结果最好的分组作为检索条件,以该检索条件进行物品的统计推荐,获得对应的推荐结果;
步骤5)对步骤3)中的数据集进行关联分析,如果仅获得一个满足支持度和置信度设定条件的物品组合,则将该物品组合作为推荐结果,否则,如果获得至少两个满足支持度和置信度设定条件的物品组合,则利用协同过滤推荐算法对不同组的物品组合进行打分评估,挑选评分最高的物品组合作为推荐结果,否则,如果没有获得满足支持度和置信度设定条件的物品组合,则根据步骤3)中的约束条件进行物品的统计推荐,获得对应的推荐结果;
所述步骤5)中关联分析的步骤为:
步骤201)通过扫描数据集累计除约束物品外的每种物品对应在用户数据中数字编码为“1”的计数,并收集满足设定支持度条件的物品作为待选物品,组成数据集合L1;
步骤202)使用数据集合L1寻找包含两项待选物品组合的数据集合L2,以此类推,直至无法找到包含k项待选物品组合的数据集合;
步骤203)从包含k-1项待选物品组合的数据集合中递归计算出置信度最高的关联规则,输出具有最大支持度和置信度的关联物品组合。
2.根据权利要求1所述的多约束条件下的个性化信息推荐方法,其特征在于,所述统计推荐的步骤包括:根据用户数据的列式存储结构,分别检索出各种物品对应在用户数据中数字编码为“1”的总数,然后根据总数大小对物品排序,选择排序靠前的物品进行推荐。
3.根据权利要求1所述的多约束条件下的个性化信息推荐方法,其特征在于,所述步骤4)中聚类分析的步骤包括:
步骤101)分别在每一分组数据中任意选择k个数据对象作为该分组的初始聚类中心;
步骤102)根据每个聚类中数据对象的均值作为中心对象,根据以下公式计算每个数据对象与中心对象的距离,并根据最小距离重新对相应数据对象进行划分,所述的公式表示为:
其中,是数据对象i的坐标,是中心对象m的坐标;
步骤103)根据以下公式重新计算每个聚类中数据对象的均值:
其中,||Ci||表示第i个聚类中数据对象的总数;
步骤104)计算标准测度函数,当满足下列函数收敛时,则算法终止,否则继续执行步骤102),
其中,是第i个聚类的聚类中心对象。
4.根据权利要求3所述的多约束条件下的个性化信息推荐方法,其特征在于,所述支持度的计算公式表示为:
其中,X表示物品,D表示数据集中包含的物品种类组成的物品集合,称D中包含X的交易的个数与D中总的交易个数之比为X在D中的支持度,记作Support(X)。
5.根据权利要求4所述的多约束条件下的个性化信息推荐方法,其特征在于,所述置信度的计算公式表示为:
其中,X→Y表示X对Y的关联规则,X和Y均表示物品,定义关联规则的置信度为物品X∪Y的支持度与X的支持度之比。
6.一种多约束条件下的信息推荐系统,所述的系统包括存储器、处理器及存储在存储器上并在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现以下步骤:
步骤1)利用数据库中存储的所有物品信息构建元数据,对各种物品对应的元数据进行编码;
步骤2)根据元数据的编码数据对用户关联的物品数据进行数字编码为“1”,对用户未关联的物品数据进行数字编码为“0”,形成用户数据;
步骤3)以预设的若干种约束物品能够关联到同一用户为约束条件检索所有用户数据,如果能够检索出满足该约束条件的用户数据,则将所有满足约束条件的用户数据组成数据集,并执行步骤5),否则执行步骤4);
步骤4)将所有约束物品进行分组,在用户数据中根据分组分别进行聚类分析,寻找聚类结果最好的分组作为检索条件,以该检索条件进行物品的统计推荐,获得对应的推荐结果;
步骤5)对步骤3)中的数据集进行关联分析,如果仅获得一个满足支持度和置信度设定条件的物品组合,则将该物品组合作为推荐结果,否则,如果获得至少两个满足支持度和置信度设定条件的物品组合,则利用协同过滤推荐算法对不同组的物品组合进行打分评估,挑选评分最高的物品组合作为推荐结果,否则,如果没有获得满足支持度和置信度设定条件的物品组合,则根据步骤3)中的约束条件进行物品的统计推荐,获得对应的推荐结果;
所述步骤5)中关联分析的步骤为:
步骤201)通过扫描数据集累计除约束物品外的每种物品对应在用户数据中数字编码为“1”的计数,并收集满足设定支持度条件的物品作为待选物品,组成数据集合L1;
步骤202)使用数据集合L1寻找包含两项待选物品组合的数据集合L2,以此类推,直至无法找到包含k项待选物品组合的数据集合;
步骤203)从包含k-1项待选物品组合的数据集合中递归计算出置信度最高的关联规则,输出具有最大支持度和置信度的关联物品组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深思考人工智能机器人科技(北京)有限公司,未经深思考人工智能机器人科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710368933.X/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置