[发明专利]适用于机器学习的采集系统在审
| 申请号: | 201710860927.6 | 申请日: | 2017-09-21 |
| 公开(公告)号: | CN107562739A | 公开(公告)日: | 2018-01-09 |
| 发明(设计)人: | 曾传德 | 申请(专利权)人: | 曾传德 |
| 主分类号: | G06F17/28 | 分类号: | G06F17/28 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 610000 四川*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 适用于 机器 学习 采集 系统 | ||
1.适用于机器学习的采集系统,其特征在于,包括:
用于储存翻译原文和与翻译原文对应的翻译译文的翻译数据库;
用于选取样本原文的样本选取模块;
用于在翻译数据库中选取与样本原文最相似的翻译原文的对比模块;
用于公开发布样本原文和对比模块选取出的与样本原文最相似的翻译原文的公开平台;所述公开平台还用于公开公开征集样本原文对应的样本译文和翻译原文对应的翻译译文;同一应征者必须完成一份样本译文和翻译译文;
所述对比模块还用于将同一应征者完成的样本译文和翻译译文同时提取出来,并将翻译译文与翻译数据库中的翻译译文进行对比;如果应征者完成的翻译译文与翻译数据库中的翻译译文的相似度大于通过阈值,则对比模块将该应征者完成的样本译文和原文样本放入翻译数据库。
2.根据权利要求1所述的适用于机器学习的采集系统,其特征在于,所述对比模块对比两个句子是否相似时,解析两个句子的句法树,并得出两个句子的句法树之间的纳真值TP,误报值FP,去真值FN;所述对比模块通过下式得出两个句子的相似值:上文所述TP为纳真值,FP为误报值,FN为去真值,R为召回率,P为结构准确率,F为相似值。
3.根据权利要求1所述的适用于机器学习的采集系统,其特征在于,所述翻译数据库还用于对翻译原文和与翻译译文进行机器学习。
4.根据权利要求1所述的适用于机器学习的采集系统,其特征在于,所述公开平台还用于当应征者完成的翻译译文与翻译数据库中的翻译译文的相似度小于通过阈值,且大于封禁阈值,再次发送样本原文和翻译原文给该应征者。
5.根据权利要求4所述的适用于机器学习的采集系统,其特征在于,所述公开平台还用于当应征者完成的翻译译文与翻译数据库中的翻译译文的相似度小于封禁阈值,将该应征者封禁。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曾传德,未经曾传德许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710860927.6/1.html,转载请声明来源钻瓜专利网。





