[发明专利]一种基于碱基序列匹配分组的免疫细胞受体转录组多样性检测多重引物智能选择方法在审
申请号: | 202110996862.4 | 申请日: | 2021-08-27 |
公开(公告)号: | CN113707220A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 魏平;张翼冠 | 申请(专利权)人: | 云测医学科技(深圳)有限公司 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G06F30/20;G06F111/06 |
代理公司: | 成都瑞创华盛知识产权代理事务所(特殊普通合伙) 51270 | 代理人: | 邓瑞;张敏 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 碱基 序列 匹配 分组 免疫 细胞 受体 转录 多样性 检测 多重 引物 智能 选择 | ||
1.一种基于碱基序列匹配分组的免疫细胞受体转录组多样性检测多重引物智能选择方法,其特征在于,包括以下步骤:
S1:对于m条FR3碱基序列Si(i=1,2,...,m),采用滑动窗口将每条序列切分成不同长度的连续子串,得到所有序列不同长度的子串集;
S2:将所述所有序列不同长度的子串集去重,得到去重后的子串集;
S3:通过子串筛选条件(引物长度、退火温度、CG含量)对所述去重后的子串集中的子串进行筛选,去除不满足条件的子串后,得到子串集P={p1,p2,...,pn},子串集中某个子串表示为pj(j=1,2,...,n),计算其长度为len(pj);
S4:以所述所有序列Si(i=1,2,...,m)为行,所述子串集pj(j=1,2,...,n)为列,初始化生成m×n阶零矩阵M;通过字符串匹配,若所述子串pj(j=1,2,...,n)在所述序列Si(i=1,2,...,m)中,则将所述零矩阵M相应的第i行第j列的0替换为1,生成0-1矩阵M;
S5:计算所述替换后的M矩阵每一列的和gj(j=1,2,...,n);
S6:给所述每一列的和gj权重为w,每列子串长度len(pj)权重为1-w,计算Wj=w×gj+(1-w)×len(pj),选择最大Wj对应的子串pj,删除pj列元素值为1所对应的行以及pj列,得到新的矩阵M,输出所述权重w下对应的第一个目标子串pj;
所述w的取值范围为0w1;
S7:重复第S5~S6步,直到矩阵M为空,得到一组目标子串集P={pk|k=1,2,...,K};
S8:更改权重w的值,令矩阵M为第S4步中生成的0-1矩阵M,重复第S5~S7步,得到不同权重下的目标子串集,选择最小K对应的目标子串集,该目标子串集中的子串即为FR3序列的简并引物。
2.根据权利要求1所述的基于碱基序列匹配分组的免疫细胞受体转录组多样性检测多重引物智能选择方法,其特征在于,所述S3步骤中,所述子串筛选条件为:子串序列的GC碱基含量为0.4~0.6,退火温度为50~60摄氏度。
3.根据权利要求1或2所述的基于碱基序列匹配分组的免疫细胞受体转录组多样性检测多重引物智能选择方法,其特征在于,所述S3步骤中,所述子串筛选条件还包括:
子串的各个碱基含量需满足退火温度T(℃)区间为50~60摄氏度,退火温度计算公式如下:
其中,pA、pT、pC、pG分别代表pj中的碱基含量,目标产物长度取200。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云测医学科技(深圳)有限公司,未经云测医学科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110996862.4/1.html,转载请声明来源钻瓜专利网。