[发明专利]一种在线人工文本标记系统及方法在审
申请号: | 202010469009.2 | 申请日: | 2020-05-28 |
公开(公告)号: | CN111783391A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 王若愚;孙炜 | 申请(专利权)人: | 孙炜 |
主分类号: | G06F40/117 | 分类号: | G06F40/117;G06F16/242;G06F16/23 |
代理公司: | 上海精晟知识产权代理有限公司 31253 | 代理人: | 姜杉 |
地址: | 201100 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 在线 人工 文本 标记 系统 方法 | ||
1.一种在线人工文本标记系统,其特征在于:包括自然语言处理工具库、数据库、文本数据搜集及预处理模块、服务器模块和操作模块;其中:
所述文本数据搜集及预处理模块接收外部的文本源,按照服务器模块产生的文本需求对于所述文本源进行结构化处理,产生符合所述数据模型的所述待标记数据并存储所述待标记数据于所述数据库;
所述服务器模块从所述数据库中获得所述待标记数据,通过调用所述自然语言处理工具库的自然语言处理标记服务进行自动标记生产所述自动标记数据,并存储所述自动标记数据在所述数据库;
所述操作模块为可视化操作界面,包括数据处理互动模块,所述数据处理互动模块接收所述服务器模块中的所述待标记数据和所述自动标记数据,并用以显示、编辑和向所述服务器模块发送所述待标记数据和所述自动标记数据。
2.根据权利要求1所述的一种在线人工文本标记系统,其特征在于:所述操作模块为图形化前端模块或客户端模块,还包括:
任务管理交互模块,用以录入任务信息和操作记录并向服务器模块发送;
用户管理交互模块,用以录入用户信息并向服务器模块发送;
标记工具交互模块,用以录入人为编辑待标记数据和人为标记数据并向服务器模块发送。
3.根据权利要求2所述的一种在线人工文本标记系统,其特征在于:所述服务器模块包括:
自动标记模块,通过使用所述自然语言处理工具库所提供的自动标记服务对于所述待标记数据和/或所述人为编辑待标记数据进行标记处理产生所述自动标记数据,并将所述自动标记数据发送并存储于所述数据库;
标记内容管理模块,接收所述任务管理交互模块所列举的任务生成业务数据和所述文本需求,将所述业务数据发送并存储于所述数据库,将所述文本需求发送给所述文本数据搜集及预处理模块;
质量控制模块,对于所述待标记数据、所述自动标记数据、所述人为编辑待标记数据和所述人为标记数据采取质量控制方法对标记数据进行评价处理产生评价阈值,若所述评价阈值满足质量控制流程结束,否则向所述数据处理互动模块反馈所述评价阈值;
用户管理模块,用以接收所述用户信息并将所述用户信息所述数据库。
4.根据权利要求3所述的一种在线人工文本标记系统,其特征在于:所述数据库包括:
标记文本存储模块,以存储来自所述自动标记模块的所述操作记录、所述待标记数据和所述自动标记数据;
业务信息存储模块,用以存储来自所述标记内容管理模块产生的业务数据;
系统日志存储模块,用以存储包括所述用户信息、异常信息和所述操作记录。
5.根据权利要求1所述的一种在线人工文本标记系统,其特征在于:还包括外部接口模块,所述外部接口模块通过所述服务器模块调用所述自然语言处理标记服务,并对外提供接口。
6.根据权利要求5所述的一种在线人工文本标记系统,其特征在于:外部接口模块还包括授权管理模块,所述授权管理模块对于外部接口模块的访问进行授权管理。
7.根据权利要求1所述的一种在线人工文本标记系统,其特征在于:所述自然语言处理工具库还包括自动更新模块,所述自动更新模块能够根据所述数据库中的所述待标记数据和所述自动标记数据对于所述自然语言处理工具库中的算法进行更新处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于孙炜,未经孙炜许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010469009.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轮毂气密性检测方法及系统
- 下一篇:分层浇筑混凝土合理支架高度的判断办法