[发明专利]一种数据标注方法及装置有效
申请号: | 201810338034.X | 申请日: | 2018-04-16 |
公开(公告)号: | CN108536662B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 李正华;黄德朋;张民;陈文亮 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F40/169 | 分类号: | G06F40/169 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 215104 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 标注 方法 装置 | ||
本发明公开了一种数据标注方法,包括:通过初始端获取不同初始用户输入的目标数据的初始标注信息;判断获取到的初始标注信息是否一致;若否,则将获取到的初始标注信息传输至第一审核端,通过第一审核端获取第一审核用户根据获取到的初始标注信息输入的目标数据的第一审核标注信息,并将第一审核标注信息确定为目标数据的最终标注信息并存储。由此当多个标注人员对于同一数据的标注结果存在差异时,由标注专家或者权威标注专家快速确定该数据的最佳标注结果,提高了数据标注的效率和准确率,有利于提高标注人员的业务水平和库存标注信息的准确率。相应地,本发明公开的一种数据标注装置、设备及计算机可读存储介质也同样具有上述技术效果。
技术领域
本发明涉及自然语言标注技术领域,更具体地说,涉及一种数据标注方法、装置、设备及计算机可读存储介质。
背景技术
随着互联网技术和计算机科学技术的不断发展,人工智能愈演愈烈,而自然语言处理是人工智能中的一个重要研究方向,其融合了语言学、计算机科学、数学等学科。自然语言处理,即实现人机间自然语言通信,或实现自然语言理解和自然语言生成。而由于自然语言文本和对话在各个层次上具有广泛歧义性和多义性,此时就需要人工标注自然语言,才能为自然语言处理提供有效的便利条件。
目前,在进行自然语言的人工标注时,一般会以可视化的标注系统为辅助标注工具,标注人员通过该标注系统标注数据。其中,一般采用多个标注人员标注同一数据的方法,来提高人工标注的质量;当多人一起标注时,多个标注人员可以独立标注,也可以在同一个文档上同时看到彼此的编辑,同时标注系统同步保持最新的标注结果。但是,当多个标注人员对于同一数据的标注结果存在差异时,只能通过集体讨论或者人工选择的方法确定最佳的标注结果,由此可能会使标注工作停滞,降低标注效率,也不利于标注人员业务水平的提高;同时,也无法提高库存标注信息的准确率。
因此,当多个标注人员对于同一数据的标注结果存在差异时,如何快速确定最佳标注结果,提高数据标注的效率,是本领域技术人员需要解决的问题。
发明内容
本发明的目的在于提供一种数据标注方法、装置、设备及计算机可读存储介质,以实现当多个标注人员对于同一数据的标注结果存在差异时,快速确定最佳标注结果,提高数据标注的效率。
为实现上述目的,本发明实施例提供了如下技术方案:
一种数据标注方法,包括:
通过初始端获取不同初始用户输入的目标数据的初始标注信息;
判断获取到的初始标注信息是否一致;
若否,则将所述获取到的初始标注信息传输至第一审核端,通过所述第一审核端获取第一审核用户根据所述获取到的初始标注信息输入的所述目标数据的第一审核标注信息,并将所述第一审核标注信息确定为所述目标数据的最终标注信息并存储。
其中,所述通过所述第一审核端获取第一审核用户根据所述获取到的初始标注信息输入的所述目标数据的第一审核标注信息,并将所述第一审核标注信息确定为所述目标数据的最终标注信息并存储,包括:
通过所述第一审核端获取第一审核用户根据所述获取到的初始标注信息输入的所述目标数据的第一审核标注信息;
将所述第一审核标注信息传输至所述初始端;
通过所述初始端获取所述初始用户根据所述第一审核标注信息输入的校验信息;
判断所述校验信息是否是确认所述第一审核标注信息的信息;
若是,则将所述第一审核标注信息确定为所述目标数据的最终标注信息并存储。
其中,所述将所述第一审核标注信息确定为所述目标数据的最终标注信息并存储之后,还包括:
将所述第一审核标注信息传输至所述初始端,并通过所述初始端展示所述第一审核标注信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810338034.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自定义报表的生成方法及终端
- 下一篇:商品领域的知识融合方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置