[发明专利]一种从微信中发现特定领域微信公众号的方法在审
| 申请号: | 201810901757.6 | 申请日: | 2018-08-09 |
| 公开(公告)号: | CN109284431A | 公开(公告)日: | 2019-01-29 |
| 发明(设计)人: | 孙立远;陈训逊;王博;徐晓燕;黄亮;谢程利 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
| 主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/958 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 罗文群 |
| 地址: | 100029*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明涉及一种从微信中发现特定领域微信公众号的方涉,属于数据挖掘技术领域。所述方法包括:关联已知特定领域微信公众号的账号主体、搜索微信公众号的账号信息和文章信息,生成候选特定领域微信公众号列表,利用构建的待发现特定领域文章分类模型对其文章信息进行判断,确保其文章内容和特定领域相关,完成从微信中发现特定领域微信公众号。本发明方法解决了微信公众号账号信息和文章内容不符的问题,扩展了待发现目标的来源,且在初始配置后自循环发现,不需要长期人工干预,从而有效提高特定领域微信公众号发现的准确性、全面性和自增长性。 | ||
| 搜索关键词: | 发现 文章内容 文章信息 账号信息 数据挖掘技术 初始配置 分类模型 人工干预 全面性 自循环 构建 搜索 关联 | ||
【主权项】:
1.一种从微信中发现特定领域微信公众号的方法,其特征在于该方法包括以下步骤:(1)初始化:设置一个配置数据库,在该数据库中存放配置信息,配置信息包括从已知特定领域微信公众号中提取的代表性特点,代表性特点包括已知特定领域微信公众号的列表、关键词集合和账号主体列表;(2)通过与已知特定领域微信公众号的关联,根据上述数据库中的关键词集合,搜索微信公众号的账号信息和文章信息,生成候选特定领域微信公众号列表,具体过程如下:(2‑1)根据上述步骤(1)的配置数据库中的账号主体列表,搜索微信微信公众号的账号主体,若搜索得到与该账号主体列表相同的账号主体的微信公众号,则将该微信公众号作为候选特定领域微信公众号,若搜索不到与该账号主体列表相同的账号主体的微信公众号,则进行步骤(2‑2);(2‑2)根据上述步骤(1)的配置数据库中的关键词集合,搜索微信公众号的账号信息,账号信息包括账号名称和功能介绍,搜索微信公众号的账号名称和功能介绍,对账号名称和功能介绍分别进行判断,若账号名称或功能介绍中的关键词与上述配置数据库中的关键词一致,则将该微信公众号作为候选特定领域微信公众号,若账号名称和功能介绍中的关键词与上述配置数据库中的关键词不一致,则进行步骤(2‑3);(2‑3)根据上述步骤(1)的配置数据库中的关键词集合,搜索微信公众号的文章信息,文章信息包括文章标题和正文内容,搜索微信公众号的文章标题和正文内容,对文章标题和正文内容分别进行判断,若文章标题和正文内容中的关键词与上述配置数据库中的关键词一致,则将该微信公众号作为候选特定领域微信公众号,若账号名称和功能介绍中的关键词与上述配置数据库中的关键词不一致,则返回步骤(1);(3)将上述步骤(2‑1)、(2‑2)和(2‑3)中的候选特定领域微信公众号与上述步骤(1)的配置数据库中的公众号列表进行对比,若上述步骤(2‑1)、(2‑2)和(2‑3)中的候选特定领域微信公众号没有出现在配置数据库中的公众号列表中,则进行步骤(4),若上述步骤(2‑1)、(2‑2)和(2‑3)中的候选特定领域微信公众号出现在配置数据库中的公众号列表中,则将该微信公众号丢弃;遍历上述步骤(2‑1)、(2‑2)和(2‑3)中的所有候选特定领域微信公众号,若上述步骤(2‑1)、(2‑2)和(2‑3)中的候选特定领域微信公众号全部出现在配置数据库中的公众号列表中,则返回步骤(1);(4)获取上述步骤(3)中的候选特定领域微信公众号的文章信息,文章信息包括文章标题和正文内容;(5)采用分词和词向量表示学习方法,利用上述步骤(1)的配置数据库中的已知特定领域微信公众号的列表和关键词集合,构建一个待发现特定领域的文章分类模型;(6)利用上述步骤(5)的待发现特定领域的文章分类模型,对上述步骤(4)中的文章信息进行判断,若文章信息符合上述文章所属领域,则进入步骤(7),若文章信息不符合上述文章所属领域,则丢弃该文章信息所对应的候选特定领域微信公众号,遍历上述步骤(4)获取的所有候选特定领域微信公众号的文章信息,若文章信息全部不符合上述文章所属领域,则进行步骤(1);(7)将候选特定领域微信公众号作为发现的特定领域微信公众号,并将该发现的特定领域微信公众号保存到上述步骤(1)的配置数据库中的已知特定领域微信公众号列表中;(8)用上述步骤(7)发现的特定领域微信公众号信息更新上述步骤(1)的配置数据库;(9)重复上述步骤(2)‑步骤(8),完成从微信中发现特定领域微信公众号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810901757.6/,转载请声明来源钻瓜专利网。





