[发明专利]一种基于微博的广告推荐方法及系统有效
申请号: | 201310608335.7 | 申请日: | 2013-11-26 |
公开(公告)号: | CN103617230B | 公开(公告)日: | 2017-02-15 |
发明(设计)人: | 章昉;刘明君;赵中英 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/02 |
代理公司: | 深圳中一专利商标事务所44237 | 代理人: | 张全文 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明适用于数据挖掘领域,提供了一种基于微博的广告推荐方法及系统。所述方法包括读取微博数据;初始化微博数据,获得微博文本词项集合;删除微博文本词项集合的停用词,获得微博文本原始特征词项集合;将微博文本原始特征词项集合与特征词项字典进行映射,判断微博文本原始特征词项集合中的词项是否出现在特征词项字典中,并计算出现的词项的tf‑idf值,作为词项的特征值;判断特征词项字典的词项是否出现在微博文本原始特征词项集合中,并将没有出现的词项的特征值标记为0;将计算得到的所有特征值组成的特征向量自动分类到预先划分的类别;以自动分类的结果为依据,向用户推荐广告。本发明实施例推荐的广告也更准确,效果也更好。 | ||
搜索关键词: | 一种 基于 广告 推荐 方法 系统 | ||
【主权项】:
一种基于微博的广告推荐方法,其特征在于,所述方法包括下述步骤:读取用户的微博数据;初始化读取的微博数据,以获得微博文本词项集合,所述初始化读取的微博数据包括去除读取的微博数据中的特殊符号、非中文字符,分词;删除所述微博文本词项集合的停用词,以获得微博文本原始特征词项集合;将所述微博文本原始特征词项集合与预先生成的特征词项字典进行映射,判断所述微博文本原始特征词项集合中的词项是否出现在所述预先生成的特征词项字典中,并计算出现在所述预先生成的特征词项字典中的所述微博文本原始特征词项集合中的词项的词频‑逆向文件频率tf‑idf值,以作为所述出现在所述预先生成的特征词项字典中的所述微博文本原始特征词项集合中的词项在微博的特征值;判断所述预先生成的特征词项字典的词项是否出现在所述微博文本原始特征词项集合中,并将没有出现在所述微博文本原始特征词项集合中的所述预先生成的特征词项字典的词项的特征值标记为0;使用预先得到的分类模型将用户的微博数据自动分类到预先划分的类别中;以自动分类的结果为依据,向读取微博数据的用户推荐广告;所述以自动分类的结果为依据,向读取微博数据的用户推荐广告的步骤具体包括:统计用户的微博中每类微博所占的百分比;将统计的每类微博所占的百分比与用户在微博资料内的标签进行匹配,并将匹配成功的类别所占的百分比翻倍;向读取微博数据的用户推荐排名在前M的M个类别的广告,所述M为整数,M大于0。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310608335.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种橡胶配方
- 下一篇:一种新型电容器用橡胶密封圈及其制备方法