[发明专利]标签标注方法、装置、计算机设备和存储介质在审
| 申请号: | 202010772268.2 | 申请日: | 2020-08-04 |
| 公开(公告)号: | CN112749313A | 公开(公告)日: | 2021-05-04 |
| 发明(设计)人: | 黄剑辉;梁龙军;刘海波 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9535;G06F16/71;G06F16/75;G06F16/78;G06K9/62 |
| 代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 李文渊 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 标签 标注 方法 装置 计算机 设备 存储 介质 | ||
1.一种标签标注方法,其特征在于,所述方法包括:
获取目标搜索系统中待标注的搜索记录;
从外部搜索平台获取与所述搜索记录对应的搜索结果数据;
将所述搜索结果数据输入预设的分类模型,得到所述搜索结果数据对应的分类结果,所述分类模型的分类类别与所述目标搜索系统的索引库分类类别相同;
根据所述分类结果,对所述搜索记录进行类别标签标注。
2.根据权利要求1所述的方法,其特征在于,所述从外部搜索平台获取与所述搜索记录对应的搜索结果数据之前,还包括:
识别所述目标搜索系统的索引库数据类型;
根据所述索引库数据类型,确定与所述索引库数据类型匹配的外部搜索平台。
3.根据权利要求1所述的方法,其特征在于,所述从外部搜索平台获取与所述搜索记录对应的搜索结果数据包括:
根据所述搜索记录,构建爬取任务;
执行所述爬取任务,在外部搜索平台进行数据爬取处理,得到与所述搜索记录对应的搜索结果数据。
4.根据权利要求1所述的方法,其特征在于,所述搜索结果数据的数量为多个;
所述根据所述分类结果,对所述搜索记录进行类别标签标注包括:
获取每一项搜索结果数据的分类结果;
对各所述搜索结果数据的分类结果进行分类统计,得到分类统计结果;
根据所述分类统计结果,确定目标类别;
将所述目标类别标记为所述搜索记录的类别标签,对所述搜索记录进行类别标签标注。
5.根据权利要求4所述的方法,其特征在于,所述根据所述分类统计结果,确定目标类别包括:
获取所述搜索结果数据在所述外部搜索平台的搜索结果列表中的排序位置;
根据所述排序位置与权重数据的预设关联关系,确定各项搜索结果数据对应的权重数据;
根据所述分类统计结果和所述权重数据,确定目标类别。
6.根据权利要求4所述的方法,其特征在于,所述根据所述分类统计结果,确定目标类别包括:
根据所述分类统计结果,筛选出包含的搜索结果数据的数量最多的类别;
当所述类别的数量为多个时,分别获取各类别包含的搜索结果数据对应的类别概率数据;
根据各类别包含的搜索结果数据对应的类别概率数据,从筛选出的类别中选取目标类别。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将携带有类别标签的搜索数据作为训练数据输入初始搜索意图分类模型;
对所述初始搜索意图分类模型进行模型训练,得到用于对输入的搜索数据进行搜索意图分类处理的搜索意图分类模型。
8.一种标签标注装置,其特征在于,所述装置包括:
搜索记录获取模块,用于获取目标搜索系统中待标注的搜索记录;
外部数据获取模块,用于从外部搜索平台获取与所述搜索记录对应的搜索结果数据;
数据分类模块,用于将所述搜索结果数据输入预设的分类模型,得到所述搜索结果数据对应的分类结果,所述分类模型的分类类别与所述目标搜索系统的索引库分类类别相同;
标签标注模块,用于根据所述分类结果,对所述搜索记录进行类别标签标注。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010772268.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种住宅复合排气道及其安装方法
- 下一篇:视频获取方法和装置及存储介质





