[发明专利]适用于机器学习的采集系统在审

申请号：	201710860927.6	申请日：	2017-09-21
公开（公告）号：	CN107562739A	公开（公告）日：	2018-01-09
发明（设计）人：	曾传德	申请（专利权）人：	曾传德
主分类号：	G06F17/28	分类号：	G06F17/28
代理公司：	暂无信息	代理人：	暂无信息
地址：	610000 四川***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	适用于机器学习采集系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.适用于机器学习的采集系统，其特征在于，包括：

用于储存翻译原文和与翻译原文对应的翻译译文的翻译数据库；

用于选取样本原文的样本选取模块；

用于在翻译数据库中选取与样本原文最相似的翻译原文的对比模块；

用于公开发布样本原文和对比模块选取出的与样本原文最相似的翻译原文的公开平台；所述公开平台还用于公开公开征集样本原文对应的样本译文和翻译原文对应的翻译译文；同一应征者必须完成一份样本译文和翻译译文；

所述对比模块还用于将同一应征者完成的样本译文和翻译译文同时提取出来，并将翻译译文与翻译数据库中的翻译译文进行对比；如果应征者完成的翻译译文与翻译数据库中的翻译译文的相似度大于通过阈值，则对比模块将该应征者完成的样本译文和原文样本放入翻译数据库。

2.根据权利要求1所述的适用于机器学习的采集系统，其特征在于，所述对比模块对比两个句子是否相似时，解析两个句子的句法树，并得出两个句子的句法树之间的纳真值TP，误报值FP，去真值FN；所述对比模块通过下式得出两个句子的相似值：上文所述TP为纳真值，FP为误报值，FN为去真值，R为召回率，P为结构准确率，F为相似值。

3.根据权利要求1所述的适用于机器学习的采集系统，其特征在于，所述翻译数据库还用于对翻译原文和与翻译译文进行机器学习。

4.根据权利要求1所述的适用于机器学习的采集系统，其特征在于，所述公开平台还用于当应征者完成的翻译译文与翻译数据库中的翻译译文的相似度小于通过阈值，且大于封禁阈值，再次发送样本原文和翻译原文给该应征者。

5.根据权利要求4所述的适用于机器学习的采集系统，其特征在于，所述公开平台还用于当应征者完成的翻译译文与翻译数据库中的翻译译文的相似度小于封禁阈值，将该应征者封禁。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于曾传德，未经曾传德许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710860927.6/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于用户需求的手语翻译方法
下一篇：一种模拟计算机外设平台的文件传输方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]适用于机器学习的采集系统在审

专利文献下载