[发明专利]一种在线学习兴趣点分析方法及系统在审
申请号: | 201810736610.6 | 申请日: | 2018-07-06 |
公开(公告)号: | CN109033255A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 徐玉红 | 申请(专利权)人: | 合肥明高软件技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海精晟知识产权代理有限公司 31253 | 代理人: | 冯子玲 |
地址: | 230000 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 兴趣点 动态消息 在线学习 主题分类 查询请求信息 监测用户 社交网络 网络学习 分析 权值和 分析方法及系统 采集 分析系统 请求消息 学习兴趣 用户网络 权重 预设 合理性 学习 | ||
1.一种在线学习兴趣点分析方法,其特征在于,包括:
A000:监测用户的社交网络查询请求信息;
A001:采集用户发表的动态消息以及该用户在社交网络中所关注的动态消息;
A002:根据预先确定的兴趣分类模型,确定所述请求消息和所述动态消息的主题分类;
A003:根据所述请求消息和动态消息距离当前时间的时间距离计算消息权重;
A004:累计计算各所述主题分类在域值时间内的权值和;
A005:利用权值和乘以预设的各所述主题分类的兴趣占比率获得对应兴趣指数值;
A006:根据各所述主题分类的兴趣指数值分析该用户的兴趣分布。
2.如权利要求1所述的一种在线学习兴趣点分析方法,其特征在于,所述对于某一主题分类的兴趣指数值与用户对该主题分类的兴趣度成正比;所述社交网络包括微博、浏览器、微信;所述动态消息距离为查询请求信息、以及发表或关注动态消息距离当前时间的时间距离。
3.如权利要求1所述的一种在线学习兴趣点分析方法,其特征在于,所述兴趣分类模型预先确定的步骤如下:
B000:获取训练数据并对所述训练数据进行标注;
B001:将所述训练数据转换为特征向量集合;
B001:量化主题分类的兴趣占比率,生成基于文本的兴趣分类模型。
4.如权利要求3所述的一种在线学习兴趣点分析方法,其特征在于,B000中获取训练数据并对所述训练数据进行标注具体过程如下:
C000:使用网络爬虫从数据源处收集页面数据;
C001:对所收集的页面数据进行文本数据的抽取;
C002:根据抽取的文本数据设置若干个兴趣类别,并为每一兴趣类别添加标签。
5.如权利要求3所述的一种在线学习兴趣点分析方法,其特征在于,B001中将所述训练数据转换为特征向量集合具体过程如下:
D000:将所述训练数据按照一定规范切分成词序列;
D001:对所述词序列标注词性,并去除与兴趣识别无关的一些词;
D002:为所述词序列进行编码,并转换空间向量模型;
D003:根据所述空间向量模型,进行特征的选择,从而得到特征向量的集合。
6.如权利要求5所述的一种在线学习兴趣点分析方法,其特征在于,去除与兴趣识别无关的一些词包括:
去除介词、代词、副词以及连词;以及去除停用词,所述停用词为实际含义较少、对判断文章内容作用不大的词语。
7.如权利要求1-6任意一所述的一种在线学习新区点分析系统,其特征在于,包括监测跟踪器、信息搜寻采集模块、主题分类模块、权值计算模块、分析模块;
所述监测跟踪器分别与社交网络app、主题分类模块、权值计算模块连接;
所述信息搜寻采集模块分别与社交网络app、主题分类模块、权值计算模块连接;
所述权值计算模块分别与主题分类模块、分析模块连接;
所述监测跟踪器监测用户在社交网络上的查询请求信息;所述信息搜寻采集模块采集用户发表的动态消息、关注的动态消息;所述主题分类模块确定主题分类及其对应的兴趣占比率;所述权值计算模块根据信息搜寻采集模块传递的动态消息、关注的动态消息、监测跟踪器传递的查询请求信息计算对应主题分类的权值;所述分析模块根据各主题分类的权值计算用户的兴趣分布。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥明高软件技术有限公司,未经合肥明高软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810736610.6/1.html,转载请声明来源钻瓜专利网。