[发明专利]一种数据处理方法、计算机设备、存储介质在审
申请号: | 201910637487.7 | 申请日: | 2019-07-15 |
公开(公告)号: | CN112231655A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 徐娟;张荣;薛晖;许皓天;杨旭东 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F21/31 | 分类号: | G06F21/31;G06F16/332;G06F40/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 钱秀茹 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 计算机 设备 存储 介质 | ||
本申请实施例公开了一种数据处理方法。所述方法包括:获取文本数据,解析所述文本数据获得组成所述文本数据的多个文本元素;确定所述文本元素之间的语义关系,根据所述语义关系选取至少两个目标文本元素;根据所述至少两个目标文本元素及其语义关系,生成验证问题,并提供所述验证问题,从而将文本中文本元素之间的语义关系巧妙地应用到验证问题的生成过程,实现了自动化生成基于语义关系的验证问题,对于机器来说,在没有对文本数据进行学习的情况下,是难以理解文本元素的语义关系的,因此,避免了验证问题被破解的问题,提高了人机验证的安全性。
技术领域
本申请涉及数据处理技术领域,具体涉及一种数据处理方法、一种计算机设备、一种计算机可读存储介质。
背景技术
验证码是一种区分计算机和人类的自动测试方法,可以用于防止恶意破解密码、刷票、论坛灌水、针对某一个特定注册用户用特定程序暴力破解方式进行不断的登陆尝试。在测试中会提供一个问题由用户来解答,这个问题可以由计算机生成并评判,但是需要只有人类才能解答。由于计算机无法解答这个问题,所以回答出问题的用户就可以被认为是人类。
目前,常见的验证码实现系统主要有图片验证码、手机短信、手机语音、视频验证码和行为式验证码等。
申请人经研究发现,手机短信和语音验证码较为繁琐,会增加用户的回答成本。而随着图像处理技术的发展,特别是深度学习技术的兴起,图片和视频验证码安全性越来越差。随着图像目标检测相关技术的发展,例如,基于ImageNet(一种可视化数据库)的Faster-rcnn(Faster Region-based Convolutional Neural Networks,目标检测方法甚高速卷积神经网络),识别图中事物已经变得比较简单。随着ORC(Optical CharacterRecognition,光学字符识别)相关技术的发展,例如主流的CNN(Convolutional NeuralNetworks,卷积神经网络)+BLSTM(Bidirectional Long Short Term Memory,双向长短时记忆)+CTC(Connectionist Temporal Classification,连接时序类分类)架构,识别图中文字也不再是什么难事。而行为类验证码只能依靠基于行为的大数据分析,以及端上的安全防控,与破解者形成“拉锯战”。
发明内容
鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的数据处理方法、以及计算机设备、计算机可读存储介质。
依据本申请的一个方面,提供了一种数据处理方法,包括:
获取文本数据,解析所述文本数据获得组成所述文本数据的多个文本元素;
确定所述文本元素之间的语义关系,根据所述语义关系选取至少两个目标文本元素;
根据所述至少两个目标文本元素及其语义关系,生成验证问题及答案;
展示所述验证问题;
接收来自客户端的输入,基于所述答案,确定所述输入是否通过验证。
依据本申请的另一个方面,提供了一种数据处理方法,包括:
获取文本数据,解析所述文本数据获得组成所述文本数据的多个文本元素;
确定所述文本元素之间的语义关系,根据所述语义关系选取至少两个目标文本元素;
根据所述至少两个目标文本元素及其语义关系,生成验证问题;
提供所述验证问题。
可选地,所述语义关系包括相关关系,所述确定所述文本元素之间的语义关系包括:
确定在所述文本数据中文本元素之间的相关性数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910637487.7/2.html,转载请声明来源钻瓜专利网。