[发明专利]对象处理方法、装置及移动终端有效
申请号: | 201710024807.2 | 申请日: | 2017-01-13 |
公开(公告)号: | CN107122378B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 张岱;闫奎名;佟娜;肜博辉 | 申请(专利权)人: | 北京星选科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对象 处理 方法 装置 移动 终端 | ||
本发明实施方式提供了一种对象处理方法、装置及移动终端,涉及通信领域,其中,所述方法包括:获取待标注对象的向量;根据所述向量与标签下种子对象向量的相似度判断是否采用所述标签;若判定为采用所述标签,则通过所述标签标注所述待标注对象。由于在本发明的实施方式中,利用标签下的种子对象(具有代表性的典型对象)的向量(即种子对象向量)来取代标签自身的向量,与待标注对象的向量进行相似度计算,因此省去了对标签进行向量构造的过程,从而有效避免了人为构造标签向量所带来的问题。
技术领域
本发明涉及通信领域,更为具体而言,涉及对象处理方法、装置及移动终端。
背景技术
对象(例如,菜品)的标签是人工定义的有限集合,例如,【川菜】、【祛寒】等。利用标签标注对象的技术是基于对象与标签之间的相似性来确定是否采用该标签来标注所述对象。其中的关键技术是向量的相似度计算,即基于对象的向量与标签的向量之间的相似度来确定对象与标签之间的相似性。
然而,在现有技术当中,标签的向量通常需要人为构造,具体而言,需要人为地给标签确定若干个关键词,并给每个关键词人为地赋予权重weight_i,利用这些权重构造出标签tag_i的向量vector_i=[weight_1,weight_2,weight_3,……weight_n],然而,这种人为构造标签向量的方法受人为主观因素的影响,导致其结果不稳定。
发明内容
为解决上述技术问题,本发明提供了对象处理方法、装置及移动终端。
一方面,本发明的实施方式提供了一种对象处理方法,所述方法包括:
获取待标注对象的向量;
根据所述向量与标签下种子对象向量的相似度判断是否采用所述标签;
若判定为采用所述标签,则通过所述标签标注所述待标注对象。
在本发明的实施方式中,利用标签下的种子对象(具有代表性的典型对象)的向量(即种子对象向量)来取代标签自身的向量,与待标注对象的向量进行相似度计算,省去了对标签进行向量构造的过程,从而有效避免了上述人为构造标签向量所带来的问题。
在本发明的一些实施方式中,所述根据所述向量与标签下种子对象向量的相似度判断是否采用所述标签包括:
根据所述相似度计算所述标签的相似性得分;
确定所述相似性得分的排序位次;
识别所述排序位次是否落入设定范围;
若所述排序位次落入设定范围,则判定为采用所述标签。
在本发明的实施方式中,只有当标签的相似性得分的排序位次落入了预先设定的范围时,才判定为采用该标签对待标注对象进行标注,例如,按照相似性得分从高到低的顺序对相似性得分进行排序,只有当标签的相似性得分在第1位到第5位之间时,才判定为采用该标签;或者,按照相似性得分从低到高的顺序对相似性得分进行排序,只有当标签的相似性得分在最后1位到倒数第5位之间时,才判定为采用该标签,由此可以提高利用标签标注对象的准确度。
在本发明的一些实施方式中,所述方法还包括:
构建训练语料,所述训练语料用于获取所述待标注对象的向量。
在本发明的一些实施方式中,所述构建训练语料包括:
基于对象的分类信息构建所述训练。
由于在本发明的实施方式中,所述训练语料基于对象的分类信息构建而成,因此,可以提高所述训练语料中各对象表征文本所表征的对象之间的相关性,进而可以更加准确地训练出对象的向量。
为了进一步提高标签标注的准确度,在本发明的一些实施方式中,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京星选科技有限公司,未经北京星选科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710024807.2/2.html,转载请声明来源钻瓜专利网。