[发明专利]数据处理方法、装置、终端和存储介质在审
申请号: | 201711288801.2 | 申请日: | 2017-12-07 |
公开(公告)号: | CN107967245A | 公开(公告)日: | 2018-04-27 |
发明(设计)人: | 付春玉 | 申请(专利权)人: | 泰康保险集团股份有限公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22 |
代理公司: | 北京同立钧成知识产权代理有限公司11205 | 代理人: | 杨贝贝,刘芳 |
地址: | 100031 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 终端 存储 介质 | ||
1.一种数据处理方法,其特征在于,包括:
根据用户录入的批次号从数据源中获取第一数据;
对所述第一数据的每个字符串的移入SI字符和移出SO字符进行配对检测,生成检测结果,所述检测结果用于指示字符串是否出现异常;
若所述检测结果指示字符串出现异常,则生成异常报告,所述异常报告中包括异常字符串对应的数据行号和数据特征。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一数据的每个字符的移入SI字符和移出SO字符进行配对检测,生成检测结果,包括:
累积所述第一数据的每个字符中的SI字符和SO字符的出现次数;
若所述出现次数除以2的余数不等于0,则所述检测结果指示字符串异常。
3.根据权利要求1或2所述的方法,其特征在于,所述对所述第一数据的每个字符的移入SI字符和移出SO字符进行配对检测,生成检测结果之后,所述方法还包括:
对所述第一数据进行逐行分析,获取第一数组,所述第一数组包括字符串序号、SI字符的位置、汉字字符串长度、所述空格位置、SO字符的位置和配对标识;
根据所述第一数组修复所述第一数据。
4.根据权利3所述的方法,其特征在于,所述根据所述第一数组修复所述第一数据,包括:
对所述第一数组中每个所述字符串序号对应的配对标识进行检查;
当所述配对标识为配对失败标识时,则根据所述SI字符的位置获取所述配对失败标识对应的字符串中的第一个SI字符;
若所述第一个SI字符之后存在空格,则将所述第一SI字符之后的第一个空格替换为SO字符,并根据所述汉字字符串长度将所述第一个空格之后的字符串向后移位,获取第二数据。
5.根据权利要求4所述的方法,其特征在于,所述获取第二数据之后,所述方法还包括:
对所述第二数据进行逐行分析,更新所述第一数组;
根据更新后的第一数组修复所述第二数据。
6.根据权利要求1或2所述的方法,其特征在于,所述对所述第一数据的每个字符的移入SI字符和移出SO字符进行配对检测,生成检测结果之后,所述方法还包括:
根据所述检测结果获取第三数据,所述第三数据包括异常字符串;
对所述第三数据进行逐行分析,获取第二数组,所述第二数组包括字符串序号、SI字符的位置、汉字字符串长度和空格位置;
根据所述第二数组修复所述第三数据。
7.根据权利要求6所述的方法,其特征在于,所述根据所述第二数组修复所述第三数据,包括:
根据所述第二数组中的所述SI字符的位置,获取所述第三数据的每个字符串中的SI字符;
若所述SI字符之后存在空格,则将所述SI字符之后的第一个空格替换为SO字符,并根据所述汉字字符串长度将所述第一个空格之后的字符串向后移位。
8.一种数据处理装置,其特征在于,包括:
第一获取模块,用于根据用户录入的批次号从数据源中获取第一数据;
检测模块,用于对所述第一数据的每个字符串的移入SI字符和移出SO字符进行配对检测,生成检测结果,所述检测结果用于指示字符串是否出现异常;
生成模块,用于若所述检测结果指示字符串出现异常,则生成异常报告,所述异常报告中包括异常字符串对应的数据行号和数据特征。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1~7任一项所述数据处理方法的步骤。
10.一种终端,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为通过执行所述可执行指令来执行权利要求1~7任一项所述数据处理方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司,未经泰康保险集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711288801.2/1.html,转载请声明来源钻瓜专利网。