[发明专利]基于轮廓系数的snp分型有效性评估方法、装置以及电子设备在审
申请号: | 202110497652.0 | 申请日: | 2021-05-07 |
公开(公告)号: | CN114708915A | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 杨智;李冬;贺贤汉 | 申请(专利权)人: | 杭州博日科技股份有限公司 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G06V10/762;G06K9/62 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 张萌 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 轮廓 系数 snp 有效性 评估 方法 装置 以及 电子设备 | ||
本申请提供了一种基于轮廓系数的snp分型有效性评估方法、装置以及电子设备,涉及SNP基因分型技术领域,缓解了snp分型有效性评估的技术问题。该方法包括:获取针对目标SNP位点的终点荧光强度数据;基于所述终点荧光强度数据利用聚类算法进行聚类,得到第一聚类结果;通过个体轮廓系数及预设轮廓系数指标阈值对所述第一聚类结果中的样本进行筛选,得到样本筛选结果;利用所述聚类算法对所述样本筛选结果进行聚类,得到第二聚类结果。
技术领域
本申请涉及SNP基因分型技术领域,尤其是涉及一种基于轮廓系数的snp分型有效性评估方法、装置以及电子设备。
背景技术
单核苷酸多态性(single nucleotide polymorphism,SNP)是由于单个核苷酸的改变而导致的核酸序列多态性。一般来说,一个SNP位点只有两种等位基因,因此又叫双等位基因。SNP在基因组中的发生频率比较高,大约平均每1000个碱基中就有一个多态位点,其是研究动植物等生物品系遗传变异、疾病与个体差异的关系以及个体差异对药物的耐药性存在的不同反应能力的重要依据。目前已经形成直接测序法、扩增曲线法、高分辨率熔解曲线分析(High Resolution Melting analysis,HRM)等多种检测技术。在这其中,扩增曲线法因为操作简单,只需一步聚合酶链式反应(Polymerase Chain Reaction,PCR)反应,速度快、通量大、结果容易判读等优势而经常使用。
但是,目前无论是采用人为指定,还是利用基因型特征进行自动判读,都存在分类结果的有效性评估问题。
发明内容
本发明的目的在于提供一种基于轮廓系数的snp分型有效性评估方法、装置以及电子设备,以缓解分类结果的有效性评估的技术问题。
第一方面,本申请实施例提供了一种基于轮廓系数的snp分型有效性评估方法,所述方法包括:
获取针对目标SNP位点的终点荧光强度数据;
基于所述终点荧光强度数据利用聚类算法进行聚类,得到第一聚类结果;
通过个体轮廓系数及预设轮廓系数指标阈值对所述第一聚类结果中的样本进行筛选,得到样本筛选结果;
利用所述聚类算法对所述样本筛选结果进行聚类,得到第二聚类结果。
在一个可能的实现中,所述获取针对目标SNP位点的终点荧光强度数据的步骤,包括:
利用扩增曲线法采集每个通道的针对目标SNP位点的终点荧光强度数据。
在一个可能的实现中,所述基于所述终点荧光强度数据利用聚类算法进行聚类,得到第一聚类结果的步骤,包括:
对所述终点荧光强度数据进行预处理,得到预处理结果;
利用聚类算法对所述预处理结果进行聚类,得到第一聚类结果。
在一个可能的实现中,所述对所述终点荧光强度数据进行预处理,得到预处理结果的步骤,包括:
对所述终点荧光强度数据进行归一化处理,得到归一化处理结果,并将所述归一化处理结果作为预处理结果。
在一个可能的实现中,所述利用聚类算法对所述预处理结果进行聚类,得到第一聚类结果的步骤,包括:
去除所述预处理结果中的空白样本以及无扩增样本数据;
利用聚类算法基于总体轮廓系数进行聚类分析,得到第一聚类结果;其中,所述第一聚类结果中包含分类数量、结果及总体、个体轮廓系数。
在一个可能的实现中,所述通过个体轮廓系数及预设轮廓系数指标阈值对所述第一聚类结果中的样本进行筛选,得到样本筛选结果的步骤,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州博日科技股份有限公司,未经杭州博日科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110497652.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种清肺排毒汤
- 下一篇:车辆的控制方法、装置和车辆