[发明专利]标签关联方法及装置在审
申请号: | 201610060688.1 | 申请日: | 2016-01-28 |
公开(公告)号: | CN105740404A | 公开(公告)日: | 2016-07-06 |
发明(设计)人: | 汤奇峰;叶峰 | 申请(专利权)人: | 上海晶赞科技发展有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 吴敏 |
地址: | 200072 上海市闸北区灵*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 关联 方法 装置 | ||
1.一种标签关联方法,其特征在于,包括:
对待进行标签关联的目标数据进行匹配处理,以得到目标关键词,所述匹配处理参照关键词词典进行,所述关键词词典中包含映射至一个或多个标签的关键词;
计算候选标签的权重,所述候选标签是在所述关键词词典中与所述目标关键词存在映射关系的标签;
基于所述候选标签的权重选取目标标签,建立所述目标标签与所述目标数据之间的关联关系。
2.根据权利要求1所述的标签关联方法,其特征在于,所述参照关键词词典对所述目标数据进行匹配处理,得到目标关键词,包括:
对所述目标数据进行分词处理,以得到多个词语;
去除所述关键词词典中未包含的词语,剩余的词语为目标关键词。
3.根据权利要求1所述的标签关联方法,其特征在于,参照与所述目标关键词存在映射关系的标签的数量计算所述候选标签的权重。
4.根据权利要求3所述的标签关联方法,其特征在于,若所述候选标签对应多个目标关键词,则所述计算所述候选标签的权重包括:分别计算所述候选标签对应每个关键词的得分,基于候选标签对应每个关键词的得分得到所述候选标签的权重。
5.根据权利要求1所述的标签关联方法,其特征在于,还包括:建立关键词词典,所述建立所述关键词词典包括:
获取分类体系数据;
参照所述分类体系数据得到标签和所述标签对应的数据;
对所述标签对应的数据和所述标签进行分词处理,将分词处理得到的关键词映射至所述标签,以得到所述关键词词典。
6.根据权利要求5所述的标签关联方法,其特征在于,所述建立关键词词典的方法包括:对所述关键词词典进行去重。
7.根据权利要求5所述的标签关联方法,其特征在于,所述建立关键词词典的方法包括:
检测所述关键词词典中每个关键词映射的标签的数量;
去除映射的标签的数量大于阈值的关键词。
8.一种标签关联装置,其特征在于,包括:
匹配处理单元,对待进行标签关联的目标数据进行匹配处理,以得到目标关键词,所述匹配处理参照关键词词典进行,所述关键词词典中包含映射至一个或多个标签的关键词;
标签权重计算单元,适于计算候选标签的权重,所述候选标签是在所述关键词词典中与所述目标关键词存在映射关系的标签;
关联单元,适于基于所述候选标签的权重选取目标标签,建立所述目标标签与所述目标数据之间的关联关系。
9.根据权利要求8所述的标签关联装置,其特征在于,所述匹配处理单元包括:
分词处理单元,适于对所述目标数据进行分词处理,以得到多个词语;
过滤单元,适于去除所述关键词词典中未包含的词语,剩余的词语为目标关键词。
10.根据权利要求8所述的标签关联装置,其特征在于,所述标签权重计算单元参照与所述目标关键词存在映射关系的标签的数量计算所述候选标签的权重。
11.根据权利要求10所述的标签关联装置,其特征在于,若所述候选标签对应多个目标关键词,则所述标签权重计算单元分别计算所述候选标签对应每个关键词的得分,基于候选标签对应每个关键词的得分得到所述候选标签的权重。
12.根据权利要求8所述的标签关联装置,其特征在于,还包括:关键词词典建立单元,所述关键词词典建立单元包括:
分类体系获取单元,适于获取分类体系数据;
数据提取单元,适于参照所述分类体系数据得到标签和所述标签对应的数据;
映射单元,适于对所述标签对应的数据进行分词处理,并将分词处理得到的关键词映射至所述标签,以得到所述关键词词典。
13.根据权利要求12所述的标签关联装置,其特征在于,所述关键词词典建立单元包括:去重单元,适于对所述关键词词典进行去重。
14.根据权利要求12所述的标签关联装置,其特征在于,所述关键词词典建立单元包括:
数量检测单元,适于检测所述关键词词典中每个关键词映射的标签的数量;
整理单元,适于去除映射的标签的数量大于阈值的关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海晶赞科技发展有限公司,未经上海晶赞科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610060688.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种信息标引和检索方法
- 下一篇:数字图像的语义标签的获取方法及装置