[发明专利]基于异构网络信息嵌入模型的交互可视推荐方法在审
| 申请号: | 202111371845.8 | 申请日: | 2021-11-18 |
| 公开(公告)号: | CN114238750A | 公开(公告)日: | 2022-03-25 |
| 发明(设计)人: | 汤颖;王攸妍;周元博 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/906;G06F16/904;G06F16/215;G06K9/62;G06N3/04;G06N3/08;G06V10/80 |
| 代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵 |
| 地址: | 310014 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 网络 信息 嵌入 模型 交互 可视 推荐 方法 | ||
基于异构网络信息嵌入模型的交互可视推荐方法,包括:步骤1:对数据进行爬取和清洗;从真实的豆瓣电影网站中收集豆瓣用户数据和豆瓣电影数据,进行清洗;步骤2:获取模型训练过程中的参数和特征数据,对预处理好的电影数据构造异构电影信息网络作为模型的输入,接着使用异构嵌入模型HetGNN,KGAT和NIRec进行训练,保留训练过程中的相关参数和特征信息;步骤3:基于用户交互的模型对比探索,基于所保留的路径特征数据,根据不同指标数据以及模型参数设计相应的可视化图表;步骤4:基于异构嵌入模型的交互可视推荐,学习异构图中多类型的对象和关系,挖掘隐含的丰富结构和语义信息用于推荐任务。本发明解决了推荐的黑盒问题,增加了推荐结果的可解释性。
技术领域
本发明提出了一种异构网络嵌入模型的可视分析方法,该方法系统性地探索和比较三个具有代表性的嵌入模型对于下游推荐任务表现的差异,模型在网络嵌入过程中所存在的共同模式,以及推荐结果的来源信息,增加了推荐的可解释性。
背景技术
现实世界中的对象及其相互关系通常都是多类型的,为了在数据挖掘中更好的保留其复杂的结构信息和丰富的语义信息,研究人员将不同类型的对象及其交互信息,甚至来源于不同数据源的信息融合成一个信息网络,并称为异构信息网络。
近年来,随着深度神经网络的发展,一些研究人员尝试将深度模型应用到异构网络嵌入中,相较于浅层模型,深度模型使用神经网络从节点属性和节点间的交互中学习嵌入,能够更好的捕获非线性关系,从而保留更多的结构信息和语义信息。然而,利用元路径进行异构网络嵌入的方法,因其需要领域知识而被认为具有一定局限性;利用信息传递机制进行高阶关系的建模方法,因其聚合了周围所有邻居的特征被认为引入噪声信息。以上两种方法在理论上有着各自的优缺点,然而,通过不同方式所学习到的用户特征究竟有何差异?是否有效保留了其特征信息?特别在推荐任务中,不同模型的评估值相似,是否意味着推荐结果的有效性一致,同一模型对不同用户的推荐是否保留其个性化,这些问题对于推荐而言十分值得探索。
然而,目前的大多数模型可视化工作都集中在分析一个单一的模型,且处理的数据多为可直接观察的图像数据,而异构网络嵌入将高维特征映射成低维向量,无法进行直接对比或直观理解其学习过程中所包含的特征。此外,现有的多模型可视对比方法虽然可以通过可视化神经元的激活状况将模型内在特征与模型表现进行分析,但此方法并不适用于异构网络嵌入模型。
发明内容
为了克服现有技术的的上述不足,本发明提出了一种面向异构网络嵌入模型的可视对比分析方法。
本发明首先对用于评估模型的数据进行爬取和清洗,然后统一各模型的下游任务与评估指标,将处理好的数据作为各模型的输入,进行异构网络嵌入的学习,并保留学习过程中的大量参数与所学特征信息;然后提取其中的有效特征并设计数据可视化视图对其进行展示;最后设计交互操作对嵌入结果中的异常数据进行挖掘,以评估模型的有效性以及探索各模型之间的共同模式。
基于异构网络信息嵌入模型的交互可视推荐方法,包括如下步骤:
步骤1:对数据进行爬取和清洗;从真实的豆瓣电影网站中收集豆瓣用户数据和豆瓣电影数据,并以一定规则对其进行清洗,保证数据的有效性;
1.1获取原始数据集,随机选取一位豆瓣用户,根据其观影数量的百分比进行随机保留,并从其被关注列表中随机选取三位用户,重复上述过程;接着,统计所有用户的观影记录,保留有效电影编号,并进行电影信息的爬取;
1.2对原始数据集进行数据预处理,为针对模型的评估更加公平有效,即防止出现无效数据,该方案以用户的观影记录至少50、电影被有效用户观看次数20等条件进行数据过滤;因推荐模型通常存在冷启动问题,为此保留10%的观影记录50的用户作为冷启动数据以进行特殊情况的评估。
1.3模型的公平评估,为了使模型的对比评估具有有效性,公平性,将嵌入模型的下游目标统一为推荐任务,并将它们的评估指标重构为推荐任务中最常见的评估指标,分别为准确率、召回率、AUC,计算方式如下所示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111371845.8/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





