[发明专利]一种专业领域智能化众包标注方法和系统有效

专利信息
申请号: 202210913101.2 申请日: 2022-08-01
公开(公告)号: CN114969315B 公开(公告)日: 2022-11-01
发明(设计)人: 赵彦博;徐盛 申请(专利权)人: 翼方健数(北京)信息科技有限公司;翼健(上海)信息科技有限公司
主分类号: G06F16/34 分类号: G06F16/34
代理公司: 北京沃杰永益知识产权代理事务所(普通合伙) 11905 代理人: 杨杰
地址: 100000 北京市海淀区阜成路73号A*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 专业 领域 智能化 标注 方法 系统
【权利要求书】:

1.一种专业领域智能化众包标注方法,其特征在于,包括如下步骤:

接收项目发起端的目标数据,根据目标数据创建标注标签生成标注项目,根据标注项目信息建立标注页面的交互界面;

获取目标数据的专业领域,根据专业领域的信息匹配规则对目标数据进行标注,将完成的标注结果发至项目发起端;

接收来自项目发起端的验收反馈,若通过验收则发送标注数据至项目发起端,若未通过验收则将反馈错误信息至标注人员,标注人员重新生成标注数据再发至项目发起端;

根据目标数据的标注结果获取历史标注题目信息和验收信息,根据标注结果、标注文本内容与验收信息的逻辑关系建立审核模型;

对生成的标注结果采用审核模型进行标注准确性审核;

若通过审核则发送标注结果至项目发起端,若未通过审核则将差异数据进行反馈,根据差异数据调整信息匹配规则生成新的标注结果;

采集单个标注人员的标注数据和验收数据,根据标注数据量生成工作统计数据,

根据验收数据结果对标注数据量进行加权计算生成个人积分数据;

将工作统计数据和个人积分数据分别同步至标注人员端和项目发起端;

所述根据目标数据创建标注标签生成标注项目具体为:

获取目标数据的领域设置参数,生成目标数据的相关领域标签;

获取来自项目发起端的领域标签设置,根据相关领域标签与领域标签设置的匹配度生成专业领域标签;

生成包含专业领域标签、标注文本和批注列表的标注项目版块;

当专业领域标签处于激活状态时,对选中的标注文本进行提取生成标注文本内容并对标注文本内容进行预设的标记颜色展示;

当识别到鼠标悬停在标注文本内容上时展示专业领域标签名称;

当标注题目被选中时,在接收到专业领域标签的关闭信号后取消相应的标注文本内容的标记颜色;

获取来自项目发起端的自定义模式设置,根据模式设置参数选择是否对标注项目信息进行加密;

获取模式设置参数中的承接对象信息生成加密密钥对标注项目信息进行加密,承接对象利用自身信息对其进行解密后获取标注项目信息;

所述根据标注项目信息建立标注页面的交互界面具体为:

当开启批量标注设置时,采集标注文本内容数据中的关键字段,根据关键字段在目标数据中搜索所有相同的字段信息并同时设置为标注文本内容。

2.根据权利要求1所述的专业领域智能化众包标注方法,其特征在于,还包括:

采集标注文本内容中的数据类型,根据数据类型获取相关领域标注模型;

根据标注文本内容中的关键字段信息和阈值设定信息获取历史标注数据对相关领域标注模型进行学习训练并以此为模型对目标数据进行预标注。

3.根据权利要求1所述的专业领域智能化众包标注方法,其特征在于,还包括:

根据标注文本内容建立标注文本内容文件保存至业务数据库,用于获取标注业务数据,以及对标注中间数据进行缓存和回溯;

将标注数据转化为预设数据格式保存至标注内容数据库,用于获取标注训练数据,以及供项目发起端下载。

4.根据权利要求1所述的专业领域智能化众包标注方法,其特征在于,未通过验收则将反馈错误信息至标注人员具体为:

对待验收的标注文本内容进行选定,创建正确的专业领域标签对其进行标注;

同步正确的专业领域标签信息和相应的标注题目至批注列表中;

接收来自项目发起端的批注列表信息并反馈至标注人员。

5.根据权利要求1所述的专业领域智能化众包标注方法,其特征在于,还包括:

获取来自项目发起端的标签规则集,规则的数据结构包括规则文本和标注数据结构;

将规则集中的规则按照规则文本长度排序,针对每个标注题目新建一个错误标注集合;

在遍历每个规则的过程中,在标注文本中找到当前规则文本的所有位置并确定落在此文本段落中的当前标注三元组集合;

将正确标注和遗漏标注与题目错误标注中的标注一一对比,筛选出题目错误标注集合并输出所有题目错误标注集合不为空的标注题目。

6.一种专业领域智能化众包标注系统,其特征在于,包括业务交互模块,标注内容数据API模块以及验收判断模块;

业务交互模块:用于接收项目发起端的目标数据,根据目标数据创建标注标签生成标注项目,根据标注项目信息建立标注页面的交互界面;

标注内容数据API模块:获取目标数据的专业领域,根据专业领域的信息匹配规则对目标数据进行标注,将完成的标注结果发至项目发起端;

验收判断模块:用于接收来自项目发起端的验收反馈,若通过验收则发送标注数据至项目发起端,若未通过验收则将反馈错误信息至标注人员,标注人员重新生成标注数据再发至项目发起端;

所述专业领域智能化众包标注系统实现如权利要求1至5中任一项所述的一种专业领域智能化众包标注方法的步骤。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于翼方健数(北京)信息科技有限公司;翼健(上海)信息科技有限公司,未经翼方健数(北京)信息科技有限公司;翼健(上海)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210913101.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top