[发明专利]确定对象标签、建立标签索引、搜索对象的方法及装置在审
申请号: | 201611197791.7 | 申请日: | 2016-12-22 |
公开(公告)号: | CN108228665A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 何恒旭 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉 |
地址: | 英属开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对象标签 分词 词语 标签索引 搜索对象 文本信息 预设 标签 关键词匹配 标签设置 目标标签 匹配成功 申请 成功 | ||
本申请实施例公开了一种确定对象标签、建立标签索引、搜索对象的方法及装置。所述确定对象标签的方法包括:获取第一对象对应的第一文本信息,根据所述第一文本信息得到与所述第一对象对应的第一分词词语集;基于预设的标签与关键词的对应关系,确定所述第一分词词语集中与所述预设对应关系中的关键词匹配成功的分词词语,以及与所述匹配成功的分词词语对应的候选标签;将部分或全部所述候选标签设置为所述第一对象的目标标签。可以提高确定对象标签的效率和准确性。
技术领域
本申请涉及数字信息处理技术领域,特别涉及一种确定对象标签、建立标签索引、搜索对象的方法及装置。
背景技术
随着电子商务的发展,用户可以在电子商务平台上购买所需物品。一种情况下,电商为了保证用户能快速搜索到心仪的产品,可以为产品设置标签,并提供根据标签进行搜索的功能,以提高搜索结果与用户期望结果的匹配程度。另一种情况下,电商平台通常节日期间举办活动,若为产品设置标签,可以根据标签快速选取出适合该节日活动的产品。还有一种情况下,为产品设置标签后,可以根据设置的标签和用户偏好的匹配程度为用户推荐符合其偏好的产品。因此,为了实现上述功能,通常需要事先确定产品的标签。
现有的确定产品标签的方法有人工打标方法和分词匹配算法。人工打标方法,即工作人员查看产品后,为产品设置合适的标签。但是由于产品数量众多,人工打标过程将消耗大量人力成本且执行速度较慢,容易出现设置错标签的失误情况。分词匹配算法通常是,设置标签集,对与产品关联的文本信息进行分词处理得到与该产品对应的多个分词词语,将得到的分词词语与标签集中的标签进行匹配,分词词语与标签集中的标签相同,那么可以将该分词词语设置为该产品的标签。然而,对于关联程度高的近义词、缩写词语等,现有的分词匹配算法无法实现匹配。例如,标签集中存在标签“马尔代夫”,而产品对应的分词词语中包括“马代”,“马代”是“马尔代夫”的简称,但无法匹配成功。再例如,标签集中存在标签“潜水”,而产品对应的分词词语中包括“潜海”,“潜水”与“潜海”是近义词,但无法匹配成功。
发明内容
本申请实施例的目的是提供一种确定对象标签、建立标签索引、搜索对象的方法及装置,以提高确定对象标签和搜索对象的效率和准确性。
为解决上述技术问题,本申请实施例提供一种确定对象标签、建立标签索引、搜索对象的方法及装置是这样实现的:
一种确定对象标签的方法,包括:
获取第一对象对应的第一文本信息;
根据所述第一文本信息得到与所述第一对象对应的第一分词词语集;
基于预设的标签与关键词的对应关系,确定所述第一分词词语集中与所述预设对应关系中的关键词匹配成功的分词词语,以及与所述匹配成功的分词词语对应的候选标签;
将部分或全部所述候选标签设置为所述第一对象的目标标签。
一种建立标签索引的方法,包括:
获取包括多个参考对象的标签集与产品样品集;
按照所述参考对象的标签,对所述参考对象进行分组,并利用所述参考对象的文本信息提取各个分组的关键词;
根据提取的所述各个分组的关键词及对应的标签,形成所述标签与关键词的对应关系。
一种基于标签搜索对象的方法,包括:
提供给用户多个标签,接收用户从所述多个标签中选择第一标签的信息;所述提供给用户的标签是旅游行业的标签
将用户选择的第一标签发送给服务器,接收并展示所述服务器反馈的与第一标签对应的至少一个对象。
一种确定对象标签的装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611197791.7/2.html,转载请声明来源钻瓜专利网。