[发明专利]基于主题相似度的网页信息获取方法、装置及系统在审
申请号: | 201710862871.8 | 申请日: | 2017-09-21 |
公开(公告)号: | CN107704535A | 公开(公告)日: | 2018-02-16 |
发明(设计)人: | 胡勇军;李奕臻;谭钻华;刘洁怡 | 申请(专利权)人: | 广州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/08 |
代理公司: | 广州三环专利商标代理有限公司44202 | 代理人: | 梁顺宜,郝传鑫 |
地址: | 510000 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于主题相似度的网页信息获取方法、装置及系统。所述基于主题相似度的网页信息获取方法包括响应于用户交互端发送的目标主题,生成网页获取请求;将所述网页获取请求发送至目标服务器;接收所述目标服务器返回的所有所述目标网页;对每个所述目标网页进行解析,获得至少一个网页信息;根据预先设置的与所述目标主题相对应的主题相似度计算模型,对每个所述网页信息进行计算,获得每个所述网页信息的主题与所述目标主题之间的主题相似度;将所述主题相似度大于预设阈值的每个所述网页信息返回至所述用户交互端。采用本发明,能够提高所获取的网页信息的针对性和准确度。 | ||
搜索关键词: | 基于 主题 相似 网页 信息 获取 方法 装置 系统 | ||
【主权项】:
一种基于主题相似度的网页信息获取方法,其特征在于,包括:响应于用户交互端发送的目标主题,生成网页获取请求;将所述网页获取请求发送至目标服务器,以使所述目标服务器根据所述网页获取请求获取至少一个目标网页;接收所述目标服务器返回的所有所述目标网页;对每个所述目标网页进行解析,获得至少一个网页信息;根据预先设置的与所述目标主题相对应的主题相似度计算模型,对每个所述网页信息进行计算,获得每个所述网页信息的主题与所述目标主题之间的主题相似度;将所述主题相似度大于预设阈值的每个所述网页信息返回至所述用户交互端。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710862871.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种音频转换方法及装置
- 下一篇:软件内容展示方法及系统