[发明专利]数据类型的识别方法、系统、计算机可读存储介质及设备在审
| 申请号: | 201710910740.2 | 申请日: | 2017-09-29 |
| 公开(公告)号: | CN107766466A | 公开(公告)日: | 2018-03-06 |
| 发明(设计)人: | 钱胜杰;瞿永建;刘继硕;刘丰收 | 申请(专利权)人: | 上海望友信息科技有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 上海光华专利事务所(普通合伙)31219 | 代理人: | 徐秋平 |
| 地址: | 201315 上海市浦东新区*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据类型 识别 方法 系统 计算机 可读 存储 介质 设备 | ||
技术领域
本发明属于数据识别技术领域,涉及一种识别方法及系统,特别是涉及一种数据类型的识别方法、系统、计算机可读存储介质及设备。
背景技术
社会的发展使得电子产品与人类的生产生活越来越密不可分,而电子产品品质的优劣受制于整个电子行业的发展水平。随着中国制造2025国家战略的提出,智能制造被推向了前所未有的高度,如何在电子行业中应用智能化技术降低对人工的依赖已经成为其内在要求。
目前电子行业内数据格式种类繁多,行业内通用的做法则是由工程师根据自己的经验对设计数据进行手动的分类归档。例如:电子行业的设计数据会涉及到几十种CAD文件,比如Accel(*.pcb),Cadence(*.cad),CadenceBRD(*.brd),CR3000(*.BSF*.CCF...),CR5000(*.ftf和*pcf),Docica(*.docica),Fatf(*.asc),Gencad(*.cad*.gen),Gencam(*.gcm),IPC(*.IPC),Mentor(Neutral),ODB++(*.tgz),ODBxml(*.xml),OrCAD(*.min),Pcad(*.pdf),PowerPCB(*.asc),Protel(*.pcbdoc*.pcb),TopCAD(*.txf),Unidat(*.uni),Viscadif(*.paf),Vutrax(*.art)等等,工程师目前只能通过扩展名做出初步判断,从而进行归类,但这种方法却在遇到此种困境:文件扩展名相同或没有扩展名时,工程师无法做出判断。
因此,提供一种数据类型的识别方法、系统、计算机可读存储介质及设备,以解决现有技术在遇到文件扩展名相同或没有扩展名时,无法快速、准确的识别数据类型的瓶颈,这已成为本领域技术人员亟待解决的技术问题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种数据类型的识别方法、系统、计算机可读存储介质及设备,用于解决现有技术中在遇到文件扩展名相同或没有扩展名时,无法快速、准确的识别数据类型的问题。
为实现上述目的及其他相关目的,本发明一方面提供一种数据类型的识别方法,用于识别所接收的业务数据流的数据类型;所述数据类型的识别方法包括:编辑特征值数据库;所述特征值数据库包括用于判断业务数据流的数据类型的正则表达式及与该正则表达式相关联的特征值;不同的业务数据流对应不同的正则表达式;逐行读取所接收的业务数据流,并将其与已编辑的特征值数据库中的正则表达式进行字符串匹配,若匹配,则累计与一特征值对应的统计匹配结果,继续读取下一行数据,并将下一行数据与所述特征值数据库中的正则表达式进行字符串匹配,逐行匹配直至与该特征值对应的统计结果达到累计上限,中断匹配。
于本发明的一实施例中,所述编辑特征值数据库的步骤包括:存储特征值和正则表达式,以建立所述特征值数据库;在所述特征值数据库中,将所述特征值按照特征值出现次数进行降序排序,并将降序排序后的特征值与正则表达式相关联。
于本发明的一实施例中,所述特征值数据库还包括与每一正则表达式对应的数据类型的标注、累计匹配结果及统计匹配结果。
于本发明的一实施例中,若读取的业务数据流与所述特征值数据库中的正则表达式字符串匹配,在累计所述统计结果的同时,还将该统计结果存储于所述特征值数据库。
于本发明的一实施例中,在逐行读取所接收的业务数据流之后,将其与所述特征值数据库中的正则表达式进行字符串匹配之前,所述数据类型的识别方法还包括识别所述业务数据流是否来自文件数据,若否,将读取到的业务数据流按回车符分隔,并转入所述将其与所述特征值数据库中的正则表达式进行字符串匹配的步骤;若是,直接转入所述将其与所述特征值数据库中的正则表达式进行字符串匹配的步骤。
于本发明的一实施例中,读取到的业务数据流与所述特征值数据库中的正则表达式的字符串匹配包括业务数据流与正则表达式的完全匹配和业务数据流与正则表达式的相似匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海望友信息科技有限公司,未经上海望友信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710910740.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:清洁机器人(ZJ1602)
- 下一篇:涡轮增压旋风集尘器





