[发明专利]一种获取图片标注数据的方法和装置在审
申请号: | 201210303583.6 | 申请日: | 2012-08-23 |
公开(公告)号: | CN102867025A | 公开(公告)日: | 2013-01-09 |
发明(设计)人: | 胡星 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 获取 图片 标注 数据 方法 装置 | ||
【技术领域】
本发明涉及计算机处理技术领域,特别涉及一种获取图片标注数据的方法和装置。
【背景技术】
在互联网产生和存储的海量信息中,图片是一种重要的信息载体,在互联网信息提供和信息检索服务中,对图片信息进行的处理也显得越来越重要。其中图片标注数据作为图片信息处理和检索技术的基础,有着广泛的应用领域,例如:用于更加准确、全面和快速的图片搜索服务;用于通过对视觉障碍者提供图片描述来提高站点的易用性;帮助用户主动过滤掉不希望看到的图片;用于针对包含图片信息的网页和站点进行反作弊计算和处理;为机器学习和计算机视觉的进一步数据处理和数据挖掘提供初始训练数据集;通过对比针对同一图片的不同语种标注,建立起可供机器翻译系统学习的不同语种单词对应的初始数据集,等等。
现有获得图片标注数据的方法主要存在以下方式:
方式一、根据图片所在网页上下文环境中的文本提取主题词作为图片的标注数据。
方式二、利用计算机视觉技术,识别图片主题作为图片标注数据。
方式三、聘用专门的人员、外包、众包的方式人工对图片进行标注。
然而,对于方式一而言,网页中图片所处上下文的内容并不一定与图片内容强相关,因此可能会导致图片标注结果不准确。对于方式二而言,计算机视觉技术要求的计算量较大、对计算资源的要求较高。对于方式三而言,专业标注和外包的人力成本较高,需要持续投入运营成本来维持征募的标注者,还会出现作弊的可能。
【发明内容】
有鉴于此,本发明提供了一种获取图片标注数据的方法和装置,降低图片标注数据的获取成本且保证具有一定的准确性。
具体技术方案如下:
一种获取图片标注数据的方法,该方法包括:
S1、将待标注图片包含在登录验证条件中显示于登录页面;
S2、利用用户在登录页面对所述待标注图片的标注内容来获取所述待标注图片的标注数据。
根据本发明一优选实施例,所述登录验证条件中还包含:用户身份验证请求信息;
在所述步骤S2之前还包括:判断用户输入的用户身份验证信息是否正确,如果是,则登录成功,记录用户对所述待标注图片输入的标注内容,继续执行所述步骤S2;否则,登录失败,结束本次标注流程。
根据本发明一优选实施例,所述登录验证条件中还包括标注数据已知的图片;
在所述步骤S2之前还包括:判断用户对所述标注数据已知的图片输入的标注内容是否正确,如果是,则登录成功,记录用户对所述待标注图片输入的标注内容,继续执行所述步骤S2;否则,登录失败,结束本次标注流程。
根据本发明一优选实施例,所述登录验证条件中还包含:用户身份验证请求信息;
在所述记录用户对所述待标注图片输入的标注内容之前还包括:判断用户输入的用户身份验证信息是否正确,如果用户输入的用户身份验证信息正确并且用户对所述标注数据已知的图片输入的标注内容也正确,则确定登录成功,继续执行所述记录用户对所述待标注图片输入的标注内容;否则,登录失败,结束本次标注流程。
根据本发明一优选实施例,该方法还包括:
在所述登录页面上提供更换标注数据已知的图片的选项;
当用户点击所述选项时,在所述登录页面上更换一副标注数据已知的图片。
根据本发明一优选实施例,将同一个待标注图片显示于多个用户的登录页面;
所述步骤S2包括:记录多个用户对所述待标注图片输入的标注内容,如果超过设定比例的用户输入了相同的标注内容,则将该相同的标注内容确定为所述待标注图片的标注数据。
根据本发明一优选实施例,在所述步骤S1中,所述待标注图片直接显示在登录页面上;或者,
当鼠标悬停在登录页面的特定区域时将所述待标注图片显示在登录页面上。
一种获取图片标注数据的装置,该装置包括:
验证推送单元,用于将待标注图片包含在登录验证条件中显示于登录页面;
标注获取单元,用于利用用户在登录页面对所述待标注图片的标注内容来获取所述待标注图片的标注数据。
根据本发明一优选实施例,所述登录验证条件中还包含:用户身份验证请求信息;
该装置还包括:
身份验证单元,用于判断用户输入的用户身份验证信息是否正确;
登录处理单元,用于在所述身份验证单元的判断结果为是时,确定登录成功,触发所述标注获取单元;否则,确定登录失败;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210303583.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置