[发明专利]通用标签挖掘方法、装置、服务器及介质有效
申请号: | 201711294952.9 | 申请日: | 2017-12-08 |
公开(公告)号: | CN107992585B | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 冯欣伟;曹徐平;张一麟;李莹 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种通用标签挖掘方法、装置、服务器及介质,所述方法包括:将包含标签占位符以及所述标签占位符的属性的标签种子规则与历史搜索信息进行匹配,确定匹配的标签;组合已有的标签种子规则和匹配得到的标签,以构建新的搜索序列集合;对所述新的搜索序列集合中包含的各搜索序列作泛化处理得到新的标签种子规则,并返回执行所述新的标签种子规则与历史搜索信息匹配操作确定新的标签,直至标签和标签种子规则满足收敛条件。本发明实施例提供的方法能够挖掘出更加全面、深刻的标签,并且整体标签挖掘的流程不依赖垂类网站,可以使用相同的流程对各种类型网页进行标签挖掘,大大降低了开发工作时间,满足了用户的具体化需求。 | ||
搜索关键词: | 通用 标签 挖掘 方法 装置 服务器 介质 | ||
【主权项】:
一种通用标签挖掘方法,其特征在于,包括:将包含标签占位符以及所述标签占位符的属性的标签种子规则与历史搜索信息进行匹配,确定匹配的标签;组合已有的标签种子规则和匹配得到的标签,以构建新的搜索序列集合;对所述新的搜索序列集合中包含的各搜索序列作泛化处理得到新的标签种子规则,并返回执行所述新的标签种子规则与历史搜索信息匹配操作确定新的标签,直至标签和标签种子规则满足收敛条件。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711294952.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种温度敏感控制器
- 下一篇:一种智能实验室调控系统