[发明专利]一种基于高斯混合模型的用户知识需求模型构建方法有效
申请号: | 201710321921.1 | 申请日: | 2017-05-09 |
公开(公告)号: | CN107220233B | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 郝佳;杨念;王国新;阎艳;杨剑雄;余俊;贾良跃 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/253;G06N5/00 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 郭德忠;李爱英 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 混合 模型 用户 知识 需求 构建 方法 | ||
本发明首次利用高斯混合模型来构建用户知识需求的模型,本发明首先基于知识库训练word2vec的skip‑gram模型,考虑功能词汇的语义信息,生成功能词汇的高维向量,然后利用选取的知识语料集训练高斯混合模型,运用多个高斯分布描述用户对于功能词汇的知识需求概率分布,运用EM方法优化高斯混合模型的参数;最后建立词汇与条目之间的映射关系,获取用户对于知识条目的需求模型,以此为基础计算知识库中用户最有可能感兴趣的知识条目并将其推送给用户;本发明构建的高斯混合模型能更贴切的拟合用户知识需求模型,并提升知识推送准确率。
技术领域
本发明属于知识服务领域,尤其涉及一种基于高斯混合模型的用户知识需求模型构建方法。
背景技术
随着近几年计算机运算能力的大幅提升和网络急速扩张,无论是在开放的互联网还是以企业为范围的局域网内,知识资源已十分丰富。随着知识的不断增加,设计人员花费在知识管理系统中的知识查找时间越来越长,甚至很难查到符合要求的知识,这不利于设计知识的共享和重用,也阻碍了设计人员设计效率和设计水平的提高。知识主动推送的方式符合大多数设计企业的现状,可以有效针对人员需求,实现知识的传递和推送服务,有效解决知识使用中的知识泛滥、知识迷航等问题,在企业内部和外部达到知识的共享和再创造。另一方面,主动推送的方式通过加快知识获取速度、提高知识获取准确率,加快企业内知识的有效传播,为效率和质量的提高乃至企业市场竞争力的提升打下良好基础。目前,知识推送系统在电子商务领域已经得到了广泛的应用,但其在产品设计领域的发展仍未成熟。描述用户的知识需求模型是发展面向知识推送系统的关键技术。然而,现有的模型构建技术主要利用关键词及其权重构建用户的知识需求模型,不能体现出知识内容的语义信息,本文提出一种基于功能词汇语义的高斯混合模型用户知识需求模型构建方法,以提高对用户知识需求兴趣拟合的准确度。
发明内容
为解决上述问题,本发明提供一种基于高斯混合模型的用户知识需求模型构建方法,本发明基于功能词汇的语义信息,能够快速准确的获取用户知识需求分布,并为面向的知识推送系统的发展奠定基础。
一种基于高斯混合模型的用户知识需求模型构建方法,包括以下步骤:
步骤1:在已有知识库中提取功能词汇,并生成功能词汇集;
步骤2:将功能词汇集中的各个功能词汇转化为向量,具体方法为:
基于知识库训练word2vec的skip-gram模型,并根据该模型生成功能词汇的向量,其中一个功能词汇对应一个向量,且向量间接体现功能词汇的语义信息,功能词汇对应的向量的相似度随着功能词汇语义信息的相似度增加而增大;
步骤3:针对用户浏览过的知识条目,统计所有知识条目中的功能词汇的词频,然后根据词频计算各个功能词汇对应的TF-IDF权重;根据功能词汇的TF-IDF权重对功能词汇进行排序,选取M个TF-IDF权重最大的功能词汇,其中功能词汇为向量的表示形式,M为设定的数目;
步骤4:基于步骤3选取出的M个功能词汇,利用EM算法求解高斯混合模型参数,得到描述功能词汇分布的高斯混合模型;
步骤5:向步骤4获得的高斯混合模型输入知识库中除步骤3中M个以外的功能词汇的向量,得到用户选择功能词汇的概率,然后根据该概率计算用户对知识库中所有知识条目的需求概率,最终得到用户对于知识条目的知识需求模型;
步骤6:将步骤5中需求概率最高的设定数目的H个知识条目推送给用户并生成知识条目集,其中H为设定的数目;基于用户浏览的知识条目,实时更新用户浏览过的知识条目集并更新步骤3中M个TF-IDF权重最大的功能词汇,然后基于更新过的M个TF-IDF权重最大的功能词汇,通过步骤4和步骤5重新计算用户对于知识条目的知识需求模型。
一种基于高斯混合模型的用户知识需求模型构建方法,步骤1所述功能词汇集的生成方法具体包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710321921.1/2.html,转载请声明来源钻瓜专利网。