[发明专利]一种原生对象的识别方法和装置有效
申请号: | 201710358639.0 | 申请日: | 2017-05-19 |
公开(公告)号: | CN108959295B | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 康战辉 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/958;G06Q50/00 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 原生 对象 识别 方法 装置 | ||
本发明实施例公开了一种原生对象的识别方法和装置,用于提高原生对象的识别准确率。本发明实施例提供一种原生对象的识别方法,包括:从社交平台上获取到待处理的第一话题,所述第一话题具有第一话题标识;根据所述第一话题标识从所述社交平台上搜索到包含所述第一话题的M个对象,所述M为正整数;统计所述M个对象中每个对象上出现的应用账号,从而得到出现频次处于前N个的应用账号,所述N为正整数;根据预置的账号过滤规则从所述出现频次处于前N个的应用账号中识别出第一应用账号,将所述第一应用账号所发表的对象确定为原生对象。
技术领域
本发明涉及计算机技术领域,尤其涉及一种原生对象的识别方法和装置。
背景技术
互联网具有信息传播速度快的特点,有些话题在社交平台上被迅速传播。例如,在网上广泛传播的“罗一笑事件”引起了很多读者的广泛讨论,也很自然的成为社交平台(例如微信平台)上热度较高的文章,不少用户后期在微信公众号上看到了罗一笑父亲罗尔的那篇《罗一笑,你给我站住》,这篇文章可能已经是经过其他公众号转载过的,而不是原生文章。其中,原生文章即是罗尔最早在自己公众号上写的那篇文章。
在当前的话题榜单处理过程中需要识别出原生文章,现有技术中原生文章的识别方法是根据微信朋友圈转发量或分享量最大的文章确定为某个话题的原生文章。
现有技术中提供的原生文章的识别方法需要满足如下假设才能正确识别出原生文章,即按照现有技术需要假设话题是原生文章本身的爆发性转发,进而得到广泛传播的。但在实际问题分析中发现,这种假设往往不一定成立。如果某个话题的出现不是通过原生文章本身,而是通过其他某个公众号,尤其是某个大V公众号转载这篇文章,进而在社交平台(比如微信平台)上得到爆发性传播的话,此时按照现有技术,则会将大V公众号转发的那篇文章误识别为原生文章,从而导致现有技术中原生文章的识别方法存在识别错误的可能性,原生文章的识别准确率较低。
发明内容
本发明实施例提供了一种原生对象的识别方法和装置,用于提高原生对象的识别准确率。
为解决上述技术问题,本发明实施例提供以下技术方案:
第一方面,本发明实施例提供一种原生对象的识别方法,包括:
从社交平台上获取到待处理的第一话题,所述第一话题具有第一话题标识;
根据所述第一话题标识从所述社交平台上搜索到包含所述第一话题的M个对象,所述M为正整数;
统计所述M个对象中每个对象上出现的应用账号,从而得到出现频次处于前N个的应用账号,所述N为正整数;
根据预置的账号过滤规则从所述出现频次处于前N个的应用账号中识别出第一应用账号,将所述第一应用账号所发表的对象确定为原生对象。
第二方面,本发明实施例还提供一种原生对象的识别装置,包括:
话题获取模块,用于从社交平台上获取到待处理的第一话题,所述第一话题具有第一话题标识;
对象搜索模块,用于根据所述第一话题标识从所述社交平台上搜索到包含所述第一话题的M个对象,所述M为正整数;
账号统计模块,用于统计所述M个对象中每个对象上出现的应用账号,从而得到出现频次处于前N个的应用账号,所述N为正整数;
账户过滤模块,用于根据预置的账号过滤规则从所述出现频次处于前N个的应用账号中识别出第一应用账号,将所述第一应用账号所发表的对象确定为原生对象。
本申请的第三方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
从以上技术方案可以看出,本发明实施例具有以下优点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710358639.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种访问搜索引擎的方法和装置
- 下一篇:网页访问错误的处理方法和装置