[发明专利]基于系统进化树的泛基因组构建方法和构建装置在审

专利信息
申请号: 202010260748.0 申请日: 2020-04-03
公开(公告)号: CN111477281A 公开(公告)日: 2020-07-31
发明(设计)人: 张锦波;鲍冠辉;李季 申请(专利权)人: 北京诺禾致源科技股份有限公司;北京诺禾致源生物科技有限公司;天津诺禾致源生物信息科技有限公司;天津诺禾医学检验所有限公司;南京诺禾致源生物科技有限公司
主分类号: G16B40/30 分类号: G16B40/30;G16B30/10
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 路秀丽
地址: 102200 北京市昌平区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供了一种基于系统进化树的泛基因组构建方法和构建装置。该构建方法包括:对不同株系的菌株进行系统进化树构建,得到系统进化树;根据不同株系的菌株在系统进化树上的不同位置,按照从底层到顶层的方向两两聚类,逐层进行泛基因组构建,得到不同株系总的泛基因组。该方法从底层到顶层的泛基因组构建,不仅解决了现有方法中比对结果不准确的问题,而且使得每一个进化节点的泛基因组都可以得到,从而可以从更加细致的进化角度来分析存在/缺失变异结果。
搜索关键词: 基于 系统 进化 基因组 构建 方法 装置
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京诺禾致源科技股份有限公司;北京诺禾致源生物科技有限公司;天津诺禾致源生物信息科技有限公司;天津诺禾医学检验所有限公司;南京诺禾致源生物科技有限公司,未经北京诺禾致源科技股份有限公司;北京诺禾致源生物科技有限公司;天津诺禾致源生物信息科技有限公司;天津诺禾医学检验所有限公司;南京诺禾致源生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202010260748.0/,转载请声明来源钻瓜专利网。

同类专利
  • 病原微生物数据实时在线分析系统-202311203472.2
  • 马志;刘波 - 深圳赛威玛智能科技有限公司
  • 2023-09-19 - 2023-10-27 - G16B40/30
  • 本发明涉及数字数据处理技术领域,提出了病原微生物数据实时在线分析系统,包括:获取病原微生物数据的时间序列;根据病原微生物数据的时间序列获取病原体异变指数,根据病原体异变指数获取异变指数序列,根据异变指数序列获取拟合数值序列,根据异变指数序列以及拟合数值序列获取病原体含量稳定度;根据异变指数序列获取异变指数阶梯序列,根据异变指数阶梯序列内数据的变化规律获取密集程度指标,基于病原体含量稳定度及密集程度指标获取局部密度;利用密度峰值聚类算法获取病原微生物数据的聚类簇,根据病原微生物数据的聚类簇获取最近容易感染的病原微生物。本发明利用局部密度改进密度峰值聚类算法,提高了对病原微生物数据的聚类准确度。
  • 生物斑迹离体时间预测方法-202210354330.5
  • 张瑾;杨雪莹;徐小玉;畅晶晶;郭柯利;杜猛;刘开会;朱典;秦叶 - 公安部物证鉴定中心
  • 2022-04-06 - 2023-10-24 - G16B40/30
  • 本发明公开了生物斑迹离体时间预测方法。本发明基于深度学习和机器学习对生物斑迹的离体时间进行推断,主要通过循环神经网络和PCA模块从原始的不同离体时间生物体样本的数据中筛选出对离体时间预测有效的基因特征或微生物OTUs特征变量,通过高精度的lightGBM模型训练模块基于具有有效的基因特征或微生物OTUs特征变量的样本数据训练得到预测模型,通过该模型预测生物斑迹离体时间。实验证明,本发明所建立的方法对血液样本或唾液样本的离体预测,在模型适用时间范围内(血液样本0~168天;唾液样本0~150天),模型准确率、精确率、召回率和F1可达85%或90%以上,模型预测性能较好,符合事件处理实际需求。
  • 一种用于蛋白质复合物识别的多网络联合聚类方法-202310212326.X
  • 欧阳乐;刘家瀚 - 深圳大学
  • 2023-02-24 - 2023-10-24 - G16B40/30
  • 本发明针对现有技术的局限性,提出了一种用于蛋白质复合物识别的多网络联合聚类方法,通过联合分析不同状态下的蛋白质相互作用网络,最终得到聚类结果,分别对应网络中的蛋白质复合物,并将来自不同网络的蛋白质复合物划分为共有复合物、部分共有复合物和特有复合物;相比现有的蛋白质复合物识别算法,本发明能够更精准地识别蛋白质复合物且发现蛋白质复合物的空间动态性;实验结果表明,本发明能够联合分析不同状态下的蛋白质相互作用网络,并从中识别出不同的蛋白质复合物,具有更为准确的识别性能。
  • 增强scRNA-seq数据基因表达相互作用的方法、设备和介质-202310726725.8
  • 毛维康;郎秋蕾;陈志锋 - 杭州联川基因诊断技术有限公司
  • 2023-06-19 - 2023-10-10 - G16B40/30
  • 本发明公开了一种增强scRNA‑seq数据基因表达相互作用的方法、设备和介质,属于数据处理技术领域。所述方法首先对细胞‑基因表达谱矩阵进行主成分分析,获得能够表明细胞区别的特征基因,基于特征基因计算细胞距离,再根据细胞距离获得细胞相似性,进一步基于细胞相似性得到马尔可夫转移概率,并对细胞‑基因表达谱矩阵进行多重插补。本发明的方法能够消除细胞‑基因表达谱矩阵中的表达量噪声并填补缺失的表达量,最终能够有效增强基因表达相互作用,进一步可以提高细胞的聚类效果,有效进行细胞分型。
  • 一种可解释的基于基因选择的细胞数据分析方法-202311109976.8
  • 倪天昊;张鑫愉;李冰杰;金开秀;李洪佳 - 杭州木攸目医疗数据有限公司
  • 2023-08-31 - 2023-10-03 - G16B40/30
  • 本发明公开了一种可解释的基于基因选择的细胞数据分析方法,选择一组细胞数据;计算细胞间序距离,并基于序距离构造细胞数据的邻接矩阵;通过邻接矩阵计算分类伪标签,并基于基因与伪标签的同质性进行基因选择;为细胞数据计算细胞孤立系数,并基于孤立系数去除异常细胞;细胞数据通过序距离构建的无向图转化出新的邻接矩阵,新的邻接矩阵基于无向图中的连通分支计算出分类标签,同类标签再次构建无向图,并计算前后无向图的一致性,基于一致性得到细胞类数;根据细胞类数和邻接矩阵对细胞进行聚类,根据聚类结果和邻接矩阵,对细胞数据得到不同分辨率的可视化;根据聚类结果与可视化结果,选取不同分辨率下不同类型细胞的标记基因。
  • 空间转录组数据聚类方法及装置-202310524844.5
  • 郭洪哲;宫月;侯睿;杨家亮;田埂 - 北京元码医学检验实验室有限公司
  • 2023-05-10 - 2023-09-29 - G16B40/30
  • 本发明提供一种空间转录组数据聚类方法及装置,所述方法包括:读取空间转录组数据集中的空间转录组数据;基于所述空间转录组数据确定每个采样点与临近采样点的皮尔逊相关系数以及序列丰度区分采样点种类;基于预先构建的序列流动模型,对组织下采样点进行表达谱修正,得到降噪后的基因表达矩阵;基于降噪后的基因表达矩阵对空间转录组数据进行聚类。本发明提供的空间转录组数据聚类方法及装置,通过确定每个采样点与临近采样点的皮尔逊相关系数,充分利用细胞的空间位置信息,对空间转录组数据进行降噪处理,修正基因表达量,提高了聚类分析结果的准确性。
  • 探究FH-缺陷型肾癌关键细胞亚群的方法、装置和设备-202311099715.2
  • 曾浩;刘振华;陈铌;胡旭;孙光曦;张兴明;梁嘉宇;陈俊儒 - 四川大学华西医院
  • 2023-08-30 - 2023-09-29 - G16B40/30
  • 本发明涉及一种探究FH‑缺陷型肾癌关键细胞亚群的方法、装置和设备,属于生物工程技术领域。本发明通过基于单细胞转录组测序,对多个FH‑RCC疾病的组织样本进行测序检测,得到多个单细胞的基因表达数据;并根据单细胞的基因表达数据,将所有单细胞进行降维聚类分群,得到多个细胞亚群;通过比较各组织样本之间不同细胞亚群的比例,将比例升高的细胞亚群确定为疑似关键细胞亚群;基于细胞通讯分析,将疑似关键细胞亚群中相互作用概率最高的细胞亚群确定为FH‑RCC疾病的关键细胞亚群。通过单细胞转录组测序对FH‑RCC疾病的组织样本进行表达测序,准确地分析每一个细胞的基因表达,反映细胞间的异质性信息及组织状态,从而精确地寻找到FH‑RCC疾病的关键细胞亚群。
  • 一种基于混合模型的基因表达数据3D聚类方法-202310694778.6
  • 吕娟娟;季东超;姜立波;朱梦圆 - 山东理工大学
  • 2023-06-13 - 2023-09-01 - G16B40/30
  • 本申请涉及本申请涉及基因测序技术领域,尤其涉及一种基于相关性分析模型的基因表达数据3D聚类方法。包括:根据最大似然估计构建混合模型;基于勒让德多项式,确定向量表达式以及勒让德参数和向量待估计参数;基于SAD模型,确定协方差表达式以及协方差待估计参数;通过EM算法,针对参数进行迭代计算,确定参数的具体数值;代入具体数值至混合模型;基于BIC准则,确认聚类数目。本申请在最大似然框架下,基于多元高斯混合模型,利用勒让德多项式拟合时间或者空间的基因表达数,利用SAD模型模拟高维的协方差矩阵,全面量化基因表达在时间、空间以及环境的相关性,利用非参数方法模拟基因表达的时序变化。
  • 高分辨率熔解曲线Tm值确定方法、装置及电子设备-202310445056.7
  • 杨智;李冬;余海;贺贤汉 - 杭州博日科技股份有限公司
  • 2023-04-19 - 2023-08-04 - G16B40/30
  • 本发明提供了一种高分辨率熔解曲线Tm值确定方法、装置及电子设备,涉及PCR检测技术领域,本发明在确定熔解曲线Tm值时,先求取PCR板每个反应孔的熔解曲线对应的高阶导数曲线;然后基于每条熔解曲线对应的高阶导数曲线,确定相应熔解曲线的初始Tm值;最后通过对各条熔解曲线对应的所有初始Tm值进行聚类分析,确定每条熔解曲线的目标Tm值。这样采用高阶导数法(即求取高阶导数曲线)确定熔解曲线的初始Tm值,提高了熔点峰的分辨率,然后采用聚类分析方法确定目标Tm值,缓解了采用高阶导数法带来的信噪比下降问题,从而实现了高分辨率熔解曲线的Tm值分析,易于理解,容易实现。
  • 一种动态更新哈希索引的DNA存储聚类方法-202310549371.4
  • 王宾;王鹏浩;曹犇;郑燕芬;周士华;吕卉;张强;魏小鹏 - 大连大学
  • 2023-05-16 - 2023-07-25 - G16B40/30
  • 本发明公开了一种动态更新哈希索引的DNA存储聚类方法,包括在初始序列三个位置选取DNA片段,并将这三个DNA片段通过计算哈希码方式转化为对应的哈希值,再映射到三个哈希表中。在后续待聚类的序列中,同样在这三个位置选取DNA片段,分别计算哈希码并进行冲突检测,进而判断是否属于同一个簇;当簇中序列数量达到5条时,对核心索引集进行一次更新,以避免错误的索引导致序列错误分流。本发明动态更新哈希索引的DNA存储聚类方法,因为索引的及时更新使得簇内序列的相似性得到显著提高,避免错误的索引导致的序列被错误分流。这种方法的优点在于提高了聚类的准确性和可靠性,为大规模的DNA数据存储和提供了良好的支持。
  • 一种基于元分析构建基因调控网络的方法-202310386770.3
  • 梁潇;孙善文 - 东北林业大学
  • 2023-04-12 - 2023-07-07 - G16B40/30
  • 一种基于元分析构建基因调控网络的方法,为了解决基因调控网络通过合并多个研究的数据扩大样本量,但不同研究数据之间并不完全是同质的,导致基因调控网络误差大,准确率低的问题,它包括对获取的每个转录组学基因表达数据集进行元分析,获得显著差异基因列表;根据转录组学基因表达数据所属的物种获取转录因子基因列表,根据转录因子基因列表和显著差异基因生成核心基因列表;计算每个核心基因与每个显著差异基因的皮尔逊相关系数,根据皮尔逊相关系数构建共表达网络;对共表达网络聚类,得到多个核心基因高相关的差异基因模块;结合生物学知识与结构方程模型,根据每个模块构建对应的基因调控网络。属于基因调控网络领域。
  • 一种使用自监督特征学习的三代宏基因组分箱方法-202310216689.0
  • 江高飞;薛卫;刘佐;张家璇;韦中;徐阳春;沈其荣 - 南京农业大学
  • 2023-03-08 - 2023-06-30 - G16B40/30
  • 本发明公开了一种使用自监督特征学习的三代宏基因组分箱方法,其包括步骤为:步骤一、在已测序基因组数据基础上生成模拟长reads;步骤二、将长reads送入自监督特征表示模型训练,并保存最佳模型参数;步骤三、模型训练后,将三代reads送入模型提取特征,宏基因组long reads序列通过特征表示模型转换成特征向量后,将输入到聚类层通过聚类层进行分箱。本发明避免了以往大多数方法只看重核苷酸频率和覆盖度等统计特征而忽视long reads本身序列特征的缺点,其使用的具有半监督性质的对比学习能够有效利用已有的数据库信息,避免了以往无监督学习的盲目性。
  • 一种基于基本组分序向量的单向编码无监督分类的方法-202010105694.0
  • 田圃 - 吉林大学
  • 2020-02-19 - 2023-06-30 - G16B40/30
  • 本发明公开了一种基于基本组分序向量的单向编码无监督分类的方法,包括如下步骤:1.定义基本组分;2.对每一条记录,构建基本组分序向量;3.把基本组分序向量插入到多叉树中,4.所有记录都录入后多叉树构建完成;树中的每一个节点中的记录和所有后代节点中的记录,以及标注的局部基本组分排序反转对应的非相邻节点中的记录及其后代节点一起为一类,所以是多层次分类,距离根节点越近,则分类越粗略;5.有新数据时按照上述方法加入即可,本发明实现了高维非线性强关联复杂数据的线性时空间复杂度多层次无监督分类。实现了对超大蛋白质序列和结构数据集的无监督多层次分类,也可用于其他高维非线性强关联数据无监督分类。
  • 一种肺腺癌分子分型模型的构建方法、设备、装置以及试剂盒-202111459974.2
  • 商骏;姜和;郑媛婷;石乐明 - 复旦大学
  • 2021-12-02 - 2023-06-23 - G16B40/30
  • 本发明涉及生物技术领域,具体涉及肺腺癌亚型分子分型模型构建方法、分型设备、装置以及试剂盒。通过测定肺腺癌患者肿瘤组织COL11A1和THBS2等基因表达值,基于PAM算法构建肺腺癌患者进行分子分型模型,根据不同分型的预后特点进行,临床个性化诊疗。本发明的优点:能够将肺腺癌患者分成稳定的两类亚型,S1(预后好)和S2(预后差),S1亚型的分子趋近原位癌/微浸润癌,而S2亚型与原位癌/微浸润癌分子差异明显。S2亚型拥有更活跃的肿瘤纤维化细胞(CAF),可以使用CAF抑制剂进行术后辅助治疗,为临床医生匹配药物和精准选择治疗方案提供了依据。
  • 带组稀疏约束多模态矩阵联合分解的数据亚型分类方法-202310104611.X
  • 何昆;尹晓尧;伯晓晨;王娜;陈河兵;董方霆;李卫华 - 中国人民解放军军事科学院军事医学研究院
  • 2023-02-13 - 2023-06-09 - G16B40/30
  • 本发明提出了一种带组稀疏约束多模态矩阵联合分解的数据亚型分类方法,能够实现对任意模态间共享‑特异数据结构的挖掘。针对现实数据存在任意模态间数据结构共享的情况,本发明引入组稀疏约束,组稀疏约束是特殊的稀疏约束方法,一般以l1,2范数或l1,∞范数实现,其约束同一组的样本依赖相同的特征,而不同组的样本依赖更为不同的特征。通过将组转换为数据模态,应用组稀疏约束的方法,结合矩阵联合分解中共享‑模态特异的概念,可以实现对任意模态间共享‑特异数据结构的挖掘,在此基础上得到更为合理的聚类效果,其效果在模拟数据和真实乳腺癌数据上得到了验证。
  • 基于基因调控网络的单细胞肿瘤微环境数据分析方法-202310296417.6
  • 易星丞;戴云;靳凤艳;兰茂卓;潘晓强;孙月;李佳佳;张丽娟 - 吉林大学第一医院
  • 2023-03-24 - 2023-06-09 - G16B40/30
  • 本发明公开了一种基于基因调控网络的单细胞肿瘤微环境数据分析方法,包括以下步骤:获取若干个细胞的原始数据值,并进行预处理和特征基因识别;基于获得的特征基因之间的调控关系,构建Degree基因表征矩阵,并识别细胞亚群;对所述细胞亚群进行细胞熵的分析、差异Degree基因的识别以及基因功能富集的分析。本发明通过SCILE算法以每一基因在每一细胞中基因调控网络的重要程度评估细胞整体的干性熵值,相比于传统基于表达量的评估方法,本方法避免因高表达低调控基因对于细胞干性的影响。
  • 双缓冲模型实现大规模数据库聚类方法及系统-202010213789.4
  • 刘卫国;徐晓明 - 山东大学
  • 2020-03-24 - 2023-05-05 - G16B40/30
  • 本发明公开了双缓冲模型实现大规模数据库聚类方法及系统,针对基因序列数据库进行长度递减排序;构建匹配字典:稀疏后缀数组,将一条基因序列构建稀疏后缀数组,作为字典,其它基因序列与字典后缀数组进行匹配,匹配过程中在查询序列的某个位置采取二分查找匹配搜索,并采取逆后缀数组、最小公共子前缀数组、后缀链接进行优化提升,计算所得到的匹配值达到阈值之后,即判定为冗余序列。基于大规模数据库生物基因序列的聚类操作以及去除冗余基因序列操作都会用到针对基因序列的精确匹配操作,并且针对大规模数据文件的I/O操作,双缓冲多线程并行操作能够处理上述情况下的数据快速处理。
  • 大规模单细胞转录组数据高效聚类方法-202110459530.2
  • 高琳;史凯玥;胡宇轩;叶育森;张晨星 - 西安电子科技大学
  • 2021-04-27 - 2023-04-28 - G16B40/30
  • 本发明公开了一种大规模单细胞转录组数据高效聚类方法,主要解决现有大规模聚类方法运行时间长,效率低,甚至不能正常运行的问题。其方案为:对大规模单细胞转录组数据的基因特征进行筛选,筛选出高表达的基因,初步降低细胞维度;对细胞进行密度抽样,使抽样出的一组新样本尽可能的包含更完整的细胞类型;对抽样出的新样本进行共享最近邻SNN构图图并使用Louvain算法对共享最近邻SNN图进行聚类,获得新样本中细胞的细胞类型;对于剩下的未参与聚类的细胞,分别在已知标签的细胞中查找近似k近邻,k近邻中最多的那一类细胞的类型,即为未参与聚类的细胞类型。本发明运行时间短,效率高,可用于大规模细胞类型识别,细胞轨迹推理。
  • 一种空间转录组的双重自监督聚类分析方法及系统-202211418640.5
  • 高瑞;于娜;张道良;刘治平;谯旭 - 山东大学
  • 2022-11-14 - 2023-04-18 - G16B40/30
  • 本发明提出了一种空间转录组的双重自监督聚类分析方法及系统,涉及生物信息学领域,对待分析的空间转录组数据进行预处理,得到由基因表达数据、细胞图像特征和邻接矩阵组成的样本数据;将样本数据输入到训练好的双重自监督模型中进行聚类,得到样本数据的聚类分布;依据聚类分布,得到细胞标签,作为最终识别的细胞类型;所述双重自监督,是线性自编码器的自我监督训练和构建全局目标分布监督图卷积神经网络编码器的训练;本发明通过线性自编码器的自我监督训练和构建全局目标分布监督图卷积神经网络编码器的训练,以双重自监督的方式,提高编码器的训练效果,实现对空间转录组细胞的高效准确分类识别。
  • 一种动态蛋白质复合物识别方法-202010324055.3
  • 梁冰;吕嘉庆;张益嘉 - 大连理工大学
  • 2020-04-22 - 2023-04-18 - G16B40/30
  • 本发明提供一种动态蛋白质复合物识别方法。本发明方法,结合基因表达数据和静态PPI网络构建动态蛋白质相互作用网络;基于马尔可夫聚类对每一时刻的动态蛋白质相互作用网络进行聚类;通过核心附着结构对聚类结果进行优化,合并具有核心蛋白质的聚类和包含附着蛋白质的聚类;滤除高度重叠的蛋白质复合物,输出最终蛋白质复合物集合。本发明方法不但可以抑制小类的产生,而且能够识别重叠的蛋白质。本发明提出了从动态蛋白质相互作用网络中识别蛋白质复合物的计算方法,更符合实际生物过程的PPI网络,提供更准确的蛋白质复合物识别结果。
  • 一种多组学数据聚类方法及装置-202010019135.8
  • 蔡宏民;容文滔 - 华南理工大学
  • 2020-01-08 - 2023-04-18 - G16B40/30
  • 本发明公开了一种多组学数据聚类方法,包括:获取待测样本的多个原始组学数据,并对所述原始组学数据进行标准化,得到组学数据;构建每个所述组学数据的局部相似矩阵;将所述局部相似矩阵输入到预设的谱聚类模型,得到每个所述组学数据的聚类结果,并基于所述聚类结果更新所述局部相似矩阵;根据更新后的局部相似矩阵建立优化模型,并通过求解所述优化模型,得到全局相似度矩阵;将所述全局相似度矩阵输入到所述谱聚类模型,得到所述待测样本的亚型识别结果。本发明还公开了一种多组学数据聚类装置,能有效解决现有技术没有考虑不同组学的权重,及基于谱聚类的算法没有利用到由谱聚类得到的多个子图的节点路径信息导致影响分型准确性的问题。
  • 生物组学数据分析系统-202210730991.3
  • 臧泽林;夏翰宸;耿雨岚;徐永杰;李子青 - 西湖大学
  • 2022-06-24 - 2023-04-14 - G16B40/30
  • 本发明涉及生物组学研究,尤其涉及用于研究生物特征的生物组学数据分析系统,包括生物组学数据采集子系统、生物组学数据分析子系统、生物组学数据输出子系统,在生物组学数据分析子系统中将组学数据输入生物组学数据分析子系统,然后训练输入‑输出变换神经网络,网络将在损失函数的作用下自动筛选有用特征,并且将特征映射到低维空间,通过端到端方法将以统一的目标进行数据处理,能够保证数据结构、减小对数据的破坏,在下游任务上有更好表现。
  • 一种基于细胞质量保证的时间控制方法及系统-202010016064.6
  • 曹毓琳;杨光;滕睿頔;杨蕊;刘鹏宇;白志惠 - 北京唐颐惠康生物医学技术有限公司
  • 2020-01-07 - 2023-04-14 - G16B40/30
  • 本发明提供一种基于细胞质量保证的时间控制方法及系统,该方法包括监听实验人员进行细胞培养过程中某一操作步骤的实际操作数据c;将实际操作数据c与对应的经验操作数据范围[c1,c2]进行比较,c2大于c1;当c在[c1,c2]范围内,或c<c1或c2<c<1.3c2时,输出继续进行下一操作步骤的提示符;且输出继续监听其他操作步骤的实际操作数据并与对应的经验操作数据范围[c1,c2]进行比较的提示符;且将c2<c<1.3c2时的实际操作数据突出显示;当c≥1.3c2,输出终止实验的提示符;该方法和系统根据获得的经验操作数据范围实现对实验人员操作时间的控制,进而提高培养的细胞的综合指标,保证了细胞质量。
  • 样本表型的预测方法、装置、电子设备及存储介质-202211636683.0
  • 秦文健;赖清佩;陈实富;谢耀钦 - 深圳先进技术研究院;深圳市海普洛斯生物科技有限公司
  • 2022-12-20 - 2023-03-28 - G16B40/30
  • 本发明实施例公开了一种样本表型的预测方法、装置、电子设备及存储介质,该方法包括:根据生物性和分子间的相互作用关系,对多个样本中的多组学数据进行特征筛选,确定各样本中用于构建样本图网络的分子特征;根据各样本中分子特征之间的相似性,构建样本图网络;将样本图网络输入预测模型,对样本图网络中的各节点进行聚类,得到重构图网络和第一样本簇;基于重构图网络,对第一样本簇中的各节点所对应样本的组学类别进行预测,得到第二样本簇;根据第一样本簇和第二样本簇确定预测模型的聚类准确性,若聚类准确性满足设定条件,则得到样本表型预测结果。本发明解决了现有样本表型预测方法未充分利用多组学数据,不能准确评判聚类效果的问题。
  • 组学数据预处理流程的效果评估方法、装置、设备和介质-202111045273.4
  • 王伟光;崔先同 - 上海吉凯基因医学科技股份有限公司
  • 2021-09-07 - 2023-03-10 - G16B40/30
  • 本申请提供了一种组学数据预处理流程的效果评估方法、装置、设备和介质,通过输入原始组学表达矩阵文件及临床表型文件;执行不同的预处理流程,并将每个预处理结果分别与预处理流程的信息作为初步预处理结果;对各初步预处理结果分别采用无监督聚类方法进行分组,并记录对应的预期分组数及所采用的分组算法;采用卡帕系数法并结合所述临床表型文件对各分组结果计算评估得分,选取最优的评估得分的初步预处理结果作为最终预处理结果文件。本申请能够量化预处理过程的有效性、稳定性等信息,具有自动化程度高、处理标准统一、处理步骤重复性好等优点,也可根据输出结果直接判断输出结果可信度,可显著提高组学数据预处理流程的结果可信度及稳定性。
  • 基于注意力机制的深度学习染色体自动识别模型及系统-202211327800.5
  • 戴亚康;彭博;胡冀苏;刘燕 - 中国科学院苏州生物医学工程技术研究所
  • 2022-10-27 - 2023-02-03 - G16B40/30
  • 本发明公开了一种基于注意力机制的深度学习染色体自动识别模型,包括依次串联的:输入端卷积层、池化层、第一稠密块、通道注意力模块、第一过渡层、第二稠密块、第二过渡层、第三稠密块、第三过渡层、第四稠密块以及分类器层。本发明提供的基于注意力机制的深度学习染色体自动识别模型,通过在第一密集块后加入通道注意力模块提取重要信息、抑制冗余信息,能提高整体分类的准确率,解决现有深度学习染色体识别网络容易忽略图像不同区域特征的问题;本发明提供的基于注意力机制的深度学习染色体自动识别系统,可实现染色体的高准确率自动识别,在染色体识别及异常分析中具有很好的应用价值。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top