[发明专利]物体识别方法和装置、计算机可读存储介质有效
申请号: | 201810950784.2 | 申请日: | 2018-08-21 |
公开(公告)号: | CN109213862B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 白亚龙;梅涛 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/9535 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 王莉莉 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
本公开涉及物体识别方法和装置、计算机可读存储介质。物体识别方法包括:从网页中获取图像和图像对应的文本数据;通过将物体的标签与文本数据进行匹配,过滤与物体的标签不匹配文本数据对应的图像,得到第一候选数据集ε |
||
搜索关键词: | 物体 识别 方法 装置 计算机 可读 存储 介质 | ||
【主权项】:
1.一种物体识别方法,包括:从网页中获取图像以及图像对应的文本数据;通过将物体的标签与图像对应的文本数据进行匹配,过滤与物体的标签不匹配的文本数据对应的图像,得到第一候选数据集εT;利用有标注数据集D来训练物体识别模型;利用训练的物体识别模型来识别第一候选数据集εT中的图像,并过滤置信度低于第一阈值α的图像及其对应的文本数据,得到第一扩充数据集εTV;利用第一扩充数据集εTV中的文本数据来训练文本分类器;利用训练的文本分类器对从网页中获取的或第一候选数据集εT中图像对应的文本数据进行分类,得到第二候选数据集εT';利用训练的物体识别模型来识别第二候选数据集εT'中的图像,并过滤置信度低于第二阈值α'的图像,得到第二扩充数据集εTV',其中第二阈值α'小于第一阈值α;和合并得到的第一、第二扩充数据集εTV、εTV'和有标注数据集D,得到训练数据集D'。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810950784.2/,转载请声明来源钻瓜专利网。