[发明专利]一种双变量相关性度量方法在审
申请号: | 201410069009.8 | 申请日: | 2014-02-27 |
公开(公告)号: | CN103853923A | 公开(公告)日: | 2014-06-11 |
发明(设计)人: | 王树良;赵一萍;舒悦 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 付雷杰;杨志兵 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种双变量相关性度量方法。使用本发明能够在保持MIC方法两个重要特性的前提下,更加逼近于MIC的真实值,更能反映真实的两个变量之间的相关度。本发明对MIC方法进行改进,通过二次寻优的方法改变Y轴的划分方式,从均分Y轴的信息得到X轴最优化的信息,再去寻找Y轴优化的信息,在合理的时间内,找到比原方法更优的解,获得双变量相关度的更加精确的值,从而在信息判断时更精确,更贴合实际。 | ||
搜索关键词: | 一种 变量 相关性 度量 方法 | ||
【主权项】:
一种双变量相关性度量方法,其特征在于,包括如下步骤:步骤1,将双变量的数据点信息转换为平面坐标轴的数据点信息(X,Y),令Y轴为主变量轴,以主变量轴的值进行升序排序;步骤2,采用给定的均分行数y均分Y轴,使得均分区间中数据点的个数相等,其中,均分行数y=2,3,4,…,B/2,其中,B为设定的X,Y划分个数乘积的最大值;步骤3,当均分行数y=i时,i=2,3,4,…,B/2,根据给定的划分列数x对X轴进行划分,使得具有同样Y值的连续点划分在同一个区间中,其中,划分列数x分别为2,3,4…,B/y;步骤4,计算均分行数y=i、均分列数x=j时的最大互信息值,记为bij,其中,i=2,3,4,…,B/2,j=2,3,4…,B/y;将bij归一到[0,1]后记为aij;选取y=i时的最大aij对应的X轴划分列数为均分行数y=i时的X轴最优划分列数xei;步骤5,固定X轴划分列数为x=xei,重新划分Y轴,计算y=i时的最大互信息值并进行归一化,获得aij*;步骤6,将aij替换为aij*,获得矩阵[aij];步骤7,变换数据点(X,Y)为(Y,X),令Y轴为主变量轴,以主变量的坐标轴的值进行升序排序;重复步骤2~6,获得矩阵[aij]’;步骤8,选取[aij]和[aij]’中的元素最大的值为MIC值;步骤9,利用步骤8获得的MIC值进行度量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410069009.8/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用