[发明专利]共享资源文件防作弊方法有效

专利信息
申请号: 201711070780.7 申请日: 2017-11-03
公开(公告)号: CN107885808B 公开(公告)日: 2021-03-30
发明(设计)人: 李禹江;何渔;吴豪 申请(专利权)人: 四川文轩教育科技有限公司
主分类号: G06F16/13 分类号: G06F16/13;G06F16/14
代理公司: 成都行之专利代理事务所(普通合伙) 51220 代理人: 王记明
地址: 610000*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 共享资源 文件 作弊 方法
【说明书】:

发明公开了共享资源文件防作弊方法,所述方法包括以下步骤:S1:将入库文件转化为PDF格式文件,并把转化后的PDF格式文件上传至资源存量库中;S2:Luncene通过数据库获取资源存量库中的路径信息,通过路径信息在资源存量库中获取资源文件,Luncene装载和构建文档对象,对存量资源文件进行分词,并创建索引文件;S3:随机抽取新共享资源文件内容片段,片段数N=3次抽样,装载共享资源文件,获取共享资源文件字符总长度T、内容片段步长S=10,构建随机数集合C=字符总长度T‑步长S;提高了判定共享资源是否为作弊行为的时间,提高了整个效率。同时避免了相似文件进入资源库,节约了存储空间。

技术领域

本发明涉及一种文件防作弊方法,具体涉及共享资源文件防作弊方法。

背景技术

网络技术的高速发展,大家可以共享自己的资源文件。在有偿共享条件下,发现有小部分人,在他人已共享的文件基础上进行下载,然后微量改动,再进行共享,非法获取报酬。如果不能够对共享资源文件进行有效防作弊就会出现以下问题:

1、造成共享资源的收集成本加大。

2、相似资源文件导致存储空间浪费。

3、相似资源文件导致资源文件获取者选择成本加大。

发明内容

本发明所要解决的技术问题是造成共享资源的收集成本大、相似资源文件导致存储空间浪费、耗时过长等问题,本发明的目的就是提出一种既能够减少服务器消耗,又能快速获取新共享资源文件与存量资源文件的相似度,防止共享资源文件作弊行为。

本发明通过下述技术方案实现:

共享资源文件防作弊方法,所述方法包括以下步骤:S1:将入库文件转化为PDF格式文件,并把转化后的PDF格式文件上传至资源存量库中;S2:Luncene通过数据库获取资源存量库中的路径信息,通过路径信息在资源存量库中获取资源文件,Luncene装载和构建文档对象,对存量资源文件进行分词,并创建索引文件;S3:随机抽取新共享资源文件内容片段,片段数N=3次抽样,装载共享资源文件,获取共享资源文件字符总长度T、内容片段步长S=10,构建随机数集合C=字符总长度T-步长S;S4:若C=0,共享文件所有内容最为抽样片段内容;若C0,以随机数集合C为限,生成随机数K,获取K至K+S间的内容片段,并重复S3步骤,当内容片段数量等于N时停止抽样;S5:利用N次抽样内容片段作为检索关键字在搜索引擎做N次检索暂存检索结果;S6:对N次检索结果进行分析,计算文件在N次搜索中命中数H,文件在搜索结果中出现一次,命中数H增加1;S7;获取存量相似资源文件列表及数量Fn,文件命中数H与内容片段数N进行比较,命中率R=H/N如果命中率R=60%,该文件即为存量相似资源文件。

现有技术为了防止共享资源文件作弊行为,现采用文件内容处理技术利用“向量空间模型”计算新共享资源文件与存量资源文件的相似度。如果文件相似度超过了判定值,则判定新共享资源文件为作弊文件,文件不允许进入资源库。该技术对文件相似度的判定会耗费大量服务器资源。并且随存量资源数量增大,文件相似度的识别过程会越来越长。

进一步地,所述步骤S1中的入库文件通过转化器整体转化为PDF格式文件。采用PDF格式文件进行文件内容的存储、共享以及文件内容片段的对比时因为PDF格式文件能够较好的实现在线查看,并且在对比时,可以通过OCR等文字识别软件,快速的将文字进行识别处理。

进一步地,所述步骤S2中的数据库为MYSQL数据库。与其他的大型数据库例如Oracle、DB2、SQL Server等相比,MySQL自有它的不足之处,如规模小、功能有限,但是本发明中仅需要进行简单的存储,并且MYSQL是开放数据库,因此使用这种方式不用花一分钱(除开人工成本)就可以建立起一个稳定、免费的网站系统。

进一步地,所述步骤S6中的检索结果为内容片段对应的文件列表。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川文轩教育科技有限公司,未经四川文轩教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711070780.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top