[发明专利]量化式数据分析方法以及量化式数据分析装置有效
申请号: | 201110402747.6 | 申请日: | 2011-12-02 |
公开(公告)号: | CN103136306A | 公开(公告)日: | 2013-06-05 |
发明(设计)人: | 游国正;刘建宗;蔡奕安 | 申请(专利权)人: | 财团法人资讯工业策进会 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 徐金国 |
地址: | 中国台湾台北市*** | 国省代码: | 中国台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 量化 数据 分析 方法 以及 装置 | ||
技术领域
本发明是有关于一种量化式数据分析方法,且特别是有关于一种与信息安全相关的数据分析方法。
背景技术
近年来,一些研究机构指出,全球企业因资料外泄所造成的损失,达1兆美元以上,一些研究报告也指出,2011年的资料外泄个案是2010年的五倍多,而企业安全的十大威胁中,“员工不经意中而泄漏重要信息”和“资料被内部成员窃取”等威胁分别位于第二和第五名,由内部成员外泄机密的事件逐年增加,已与外部入侵窃取机密的比例相当。
为了保护企业内部的重要数据,许多企业均采用信息安全(information security)管理系统来监控企业内部的各种信息,避免重要数据外流而造成企业的重大损失。一般而言,这些企业的信息安全政策会对计算机的文档写出权限、光盘烧录权限、文档打印权限、软/硬件使用权限、网页浏览权限、网络传输权限及记录查询...等做出设定与纪录,以对企业内部的计算机信息进行控管。
然而,目前企业内部所采用的信息安全控管方法,大多无法十分准确有效地找出需要保密的文件,极有可能将一般员工的私人文件也当成机敏文件处理,造成员工的困扰;或是需要庞大的资源来对企业内部的文件进行管控,消耗了庞大的人力与物力成本。
发明内容
因此,本发明的一方面是在提供一种量化式数据分析方法,能够有效且准确地对企业内部的文件或是应用程序进行管控,降低人力与物力成本。
依据本发明一实施例,量化式数据分析方法应用于一计算机系统当中,以判断一待测文件是否具敏感性,此量化式数据分析方法是取得计算机系统当中的一样本数据;对样本数据的内容进行分段,以取得至少一原始数据段落;对原始数据段落进行划分,以取得多个原始文句;自原始文句当中撷取出多个原始文句属性;以及依据原始文句属性,建立多个训练特征向量。
本发明的另一方面是在提供一种量化式数据分析装置,能够有效且准确地对企业内部的文件或是应用程序进行管控,降低人力与物力成本。
依据本发明的另一实施例,量化式数据分析装置内建于一电子装置当中,以判断一待测文件或是正在执行的一应用程序是否具敏感性,此量化式数据分析装置内含一文本特征建置器以及一邻似特征搜寻器。文本特征建置器含有一数据撷取器、一数据划分器以及一文句分析器。数据撷取器取得一样本数据或是一待测文件,并分别自样本数据或是待测文件中,抽取出一原始数据或是一待测数据;数据划分器对原始数据或是待测数据的内容进行分段,以取得至少一原始数据段落或是至少一待测数据段落,并对原始数据段落或是待测数据段落进行划分,以取得多个原始文句或是多个待测文句。文句分析器自原始文句或是待测文句当中,撷取出数个原始文句属性或是数个待测文句属性,并依据原始文句属性或是待测文句属性,建立数个训练特征向量或是多个待测特征向量。邻似特征搜寻器依据待测特征向量、训练特征向量,以及差异临界值,决定待测文件是否为具敏感性。
以上实施例的量化式数据分析装置以及量化式数据分析方法,是运用量化方式参考前后文的特征,以文件内容为基础进行分析,不因单一关键词而造成误判;对于未知文件或稍作修改的已知文件皆能正确判断,增加了可应用的层面。
附图说明
为让本发明的上述和其它目的、特征、优点与实施例能更明显易懂,所附附图的说明如下:
图1是绘示本发明一实施方式量化式数据分析方法的流程图;
图2A、图2B以及图2C是绘示本发明两种实施方式量化式数据分析方法的流程图;
图3是绘示本发明一实施方式特征向量说明示意图;
图4是绘示本发明一实施方式量化式数据分析装置的方块图;
图5A、图5B以及图5C是分别绘示本发明三种实施方式当中电子装置的应用示意图。
【主要组件符号说明】
具体实施方式
以下实施例的量化式数据分析装置以及量化式数据分析方法,是运用量化方式参考前后文的特征,对文件内容为基础进行分析,未知文件或稍作修改的已知文件皆能正确判断;此外,使用者可自订相似度门槛值,作为分类的依据,增加了比对的弹性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于财团法人资讯工业策进会,未经财团法人资讯工业策进会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110402747.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置