[发明专利]一种前端界面的动态语言反混淆特征提取方法及提取系统有效
申请号: | 202310238378.4 | 申请日: | 2023-03-14 |
公开(公告)号: | CN115952411B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 王洪哲;关锋;丁兆俊;王克照;秦漫;叶海峰;曲金凤;潘昭雄;胡鹏濠;蔡静静;易洪;郭伟钧 | 申请(专利权)人: | 北京有生博大软件股份有限公司 |
主分类号: | G06F18/213 | 分类号: | G06F18/213;G06F21/14;G06F40/151;G06F40/126;G06F40/216;G06N3/0464;G06N3/08 |
代理公司: | 北京智丞瀚方知识产权代理有限公司 11810 | 代理人: | 杨乐 |
地址: | 100142 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 前端 界面 动态 语言 混淆 特征 提取 方法 系统 | ||
1.一种前端界面的动态语言反混淆特征提取方法,其特征在于,包括以下步骤:
步骤S01、逐个字符提取脚本信息中的二元语句,并将二元语句的字符转换为标准代码语言的编码字符,记录二元语句的出现频次;
步骤S02、建立一个横坐标与纵坐标均包含全部标准代码语言的二维矩阵,根据编码字符将二元语句填入二维矩阵内;
步骤S03、根据二元语句的坐标将二元语句的出现频次填入二维矩阵内,替换二元语句的坐标值;
步骤S04、对二维矩阵进行归一化处理,得到特征矩阵。
2.根据权利要求1所述的一种前端界面的动态语言反混淆特征提取方法,其特征在于:所述逐个字符提取脚本信息中的二元语句包括先删除非文字字符,然后逐个字符提取脚本信息的二元语句;
或者,在逐个字符提取脚本信息的过程中,若字符后遇到非文字字符,则二元语句直接跳过该非文字字符,与非文字字符后第一位的字符组成二元语句;
或者,在逐个字符提取脚本信息的过程中,若字符后遇到非文字字符,则放弃该字符,跳到非文字字符后的第一个字符后开始逐个字符提取二元语句。
3.根据权利要求1所述的一种前端界面的动态语言反混淆特征提取方法,其特征在于:所述标准代码语言为ASCII、UTF-8、UTF-16、UTF-32、ANSI、Unicode 中的任意一种。
4.根据权利要求1所述的一种前端界面的动态语言反混淆特征提取方法,其特征在于:所述根据编码字符将二元语句填入二维矩阵内包括将二元语句的第一个字符的取值设为X轴坐标值,二元语句中第二个字符的取值设为Y轴坐标值;
或者,将二元语句的第一个字符的取值设为Y轴坐标值,二元语句中第二个字符的取值设为X轴坐标值。
5.根据权利要求1所述的一种前端界面的动态语言反混淆特征提取方法,其特征在于:所述步骤S02之后,对所述二维矩阵进行简化,简化方法包括计算每个二元语句的熵值,筛选掉熵值不满足筛选标准的二元语句,得到简化后的二维矩阵。
6.根据权利要求5所述的一种前端界面的动态语言反混淆特征提取方法,其特征在于,所述二元语句的熵值IG(x)的计算公式如下:上式中:
H(C)为系统原本的熵,具体计算如下:C为所有文档;
为文档出现的概率,n=2,为正常文档,为混淆文档;
为固定特征X后的条件熵,具体计算如下:上式中:
P(x)为二元语句x出现的概率;
为二元语句x没有出现的概率;
为出现二元语句x的熵值,即,为中出现二元语句的频率;
为没有出现二元语句x的熵值,即,为中没有出现二元语句x的频率。
7.根据权利要求1所述的一种前端界面的动态语言反混淆特征提取方法,其特征在于;所述步骤S03中建立二元语句与出现频次的键值对,以二元语句的字符为键,出现频次为值,每次采集二元语句均会对比已建立的全部键值对;
若出现相同的二元语句,则计入所述二元语句的键值对的值中,即值+1;
若未出现相同的二元语句,则建立新的键值对。
8.根据权利要求1所述的一种前端界面的动态语言反混淆特征提取方法,其特征在于;所述归一化处理包括二维矩阵中每行的坐标值求和,得到行和值,然后将本行中每个坐标值均除以行和值,得到一个小于1的坐标值,转换完成后,每一行坐标值的加和均为1;
或者,二维矩阵中每列的坐标值求和,得到列和值,然后将本列中每个坐标值均除以列和值,得到一个小于1的坐标值,转换完成后,每一列坐标值的加和均为1。
9.一种前端界面的动态语言反混淆特征提取系统,其特征在于,包括以下模块:
二元语句提取模块,用于逐个字符提取脚本信息中的二元语句,其连接标准编码信息数据库,从标准编码信息数据库中调取标准编码信息,将二元语句的字符转换为标准代码语言的编码字符,采集二元语句的出现频次;
频次采集模块,用于采集二元语句的出现频次,计算全部二元语句的出现频次总和,计算二元语句位于出现频次总和的占比,即计算二元语句的出现频率;
二维矩阵建立模块,其连接标准编码信息数据库,建立一个横坐标与纵坐标均包含全部标准代码语言的二维矩阵,根据编码字符将二元语句填入二维矩阵内,或者将二元语句的出现频次填入二维矩阵内,并对二维矩阵进行归一化处理,得到特征矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有生博大软件股份有限公司,未经北京有生博大软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310238378.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:图像中值滤波方法、系统、介质及电子设备
- 下一篇:一种支架组件和服务器