[发明专利]一种最优超平面的构建方法、动态优化系统和构建装置有效
申请号: | 201610702124.3 | 申请日: | 2016-08-22 |
公开(公告)号: | CN106645739B | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | 徐小茏;徐静;黄振德 | 申请(专利权)人: | 深圳华晓静生物科技有限公司 |
主分类号: | G01N33/68 | 分类号: | G01N33/68 |
代理公司: | 深圳市道臻知识产权代理有限公司 44360 | 代理人: | 陈琳 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及癌症检测领域,具体涉及一种最优超平面的构建方法,包括步骤选取若干正常人与癌症患者为样本,获得所有样本中的蛋白信息;利用蛋白信息建立所有样本的蛋白信息特征数据空间;根据Tanimoto距离,构造最优超平面,该最优超平面作为识别正常人与癌症患者的分类器。还包括一种早期癌症检测的动态修正系统。本发明根据样本的蛋白信息构建最优超平面,作为识别正常人与癌症患者的分类器;同时,将蛋白信息和蛋白信息特征数据空间进行分类,并引入在蛋白信息特征数据空间中闵可夫斯基距离度量和松弛变量,以改进最优超平面的构建,最后通过动态的组合分量分类器设计,以实现系统的智能化与准确率最优化。 | ||
搜索关键词: | 一种 最优 平面 构建 方法 动态 优化 系统 装置 | ||
【主权项】:
1.一种最优超平面的构建方法,该最优超平面用于早期癌症检测,其特征在于,包括步骤:选取若干正常人与癌症患者为样本,获得所有样本中的蛋白信息;利用蛋白信息建立所有样本的蛋白信息特征数据空间;建立所有样本的蛋白信息特征数据空间的方式是,利用蛋白信息建立所有样本的蛋白信息特征向量空间;将所有样本的蛋白信息投影到蛋白信息特征向量空间中,获得所有样本的蛋白信息特征数据矩阵,并获得所有样本的蛋白信息特征数据空间;计算各样本在蛋白信息特征数据空间中的对应数据点之间的距离度量,以及计算正常人样本集合与癌症患者样本集合之间的Tanimoto距离;根据Tanimoto距离,由蛋白信息特征数据空间的距离度量出发,利用判别函数获得非线性可分模式,构造最优超平面;其中,计算距离度量的方式是:利用parzen窗函数扩展到以样本点x为中心,进行包含Pn个样本为止的扩张;根据闵可夫斯基距离度量,
在蛋白信息特征数据矩阵及蛋白信息特征数据空间中建立距离度量;其中,x,y为蛋白信息特征数据空间中样本的向量;其中,对线性可分类样本构造最优超平面的方式是,引入T个线性可分类样本,设置期望输出值dT=±1,利用偏置与负阈值概念,设置WT·XT+b>0,dT=1,WT·XT+b<0,dT=‑1,获得一个分类边缘最大的超平面;采用laglang系数方法解决约束最优问题;其中,W为新加入样本的蛋白信息矩阵;其中,对不能满足约束条件dT(WT·XT+b)≥1并出现分类误差的样本的蛋白信息矩阵,构造最优超平面的方式是,引入松弛变量ξT≥0,设置dT(WT·XT+b)≥1‑ξT;当0≤ξT≤1时,样本的数据点落入分类区域的内部,且在分类超平面的正确一侧;当ξT=0时,样本的数据点为离超平面最近的特殊样本数据点;当ξT>1时,样本的数据点在分类超平面的错误一侧;其中,对非线性可分类样本构造最优超平面的方式是,对给定的训练样本寻找W和B的最优值,在约束条件dT(WT·XT+b)≥1下,最小化关于W和松弛变量ξT的代价函数,其计算式为:
采用laglang系数方法解决约束最优问题;其中,W为新加入样本的蛋白信息矩阵,C为选定的正参数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华晓静生物科技有限公司,未经深圳华晓静生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610702124.3/,转载请声明来源钻瓜专利网。