[发明专利]一种基于深度网络自适应的scRNA-seq细胞类型识别方法在审
| 申请号: | 202111471768.3 | 申请日: | 2021-12-01 |
| 公开(公告)号: | CN114121158A | 公开(公告)日: | 2022-03-01 |
| 发明(设计)人: | 王树林;刘孟林 | 申请(专利权)人: | 湖南大学 |
| 主分类号: | G16B30/00 | 分类号: | G16B30/00 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 410082 湖南省*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 网络 自适应 scrna seq 细胞 类型 识别 方法 | ||
1.一种基于深度网络自适应的scRNA-seq细胞类型识别方法,其特征在于实施步骤:
(1)收集数据,包括通用的基准数据集,不同测序方式生成的人类胰腺组织数据集,同一物种内不同组织的数据集;
(2)对scRNA-seq数据进行预处理,不同的scRNA-seq数据集随机分为源数据集和目标数据集,源数据集的类型信息已知,目标数据集的类型信息未知,预处理包括质量控制、数据标准化、细胞类型转换三个步骤;
(3)搭建神经网络架构,首先目标域可通过自编码器初始化神经网络参数,然后源域和目标域均采用相同的神经网络作为其基本网络结构;
(4)优化框架,在源域和目标域的网络结构中均加入域自适应层,自适应层能够使得源域和目标域的数据分布更加接近,减少批次效应对最终分类结果的影响;
(5)准确识别未知scRNA-seq数据集的细胞类型,使用小批量随机梯度下降法(mini-batch SGD)对源域网络和目标网络进行参数更新和迭代优化,最终模型拥有对类型信息未知的目标数据集进行准确类型识别的能力。
2.根据权利要求1所属的基于深度网络自适应的scRNA-seq细胞类型识别方法,其特征在于数据收集阶段:
(1)基准数据集通过两种测序方式生成,分别是10x和CelSeq2;
(2)人类胰腺组织数据集通过五种测序方式生成,分别是CelSeq、CelSeq2、SmartSeq2、Fluidigmc1、inDrop;
(3)从Figshare上下载的小鼠衰老细胞图谱(Tabula Muris Senis)数据集,包括来自96307个细胞的23341个基因表达信息,包含22种组织。
3.根据权利要求1所属的基于深度网络自适应的scRNA-seq细胞类型识别方法,其特征在于数据的预处理阶段:
(1)检查原始数据集中是否存在异常值并设置阈值去除;
(2)过滤少于5000个reads和500个基因的低质量细胞,以及少于10个细胞表达的基因,使用SCANPY将每个细胞正则化为10000个读数计数,最后将数据集进行对数处理和归一化;
(3)将数据集的细胞类型信息转换为数字编号便于后续的细胞分类。
4.根据权利要求1所属的基于深度网络自适应的scRNA-seq细胞类型识别方法,其特征在于搭建神经网络架构阶段:
(1)神经网络由一个输入层和两个全连接层组成,输入层的神经元数量为数据预处理之后的基因数,全连接层的第一层使用1000个神经元,第二层使用100个神经元;
(2)在预训练阶段,使用神经网络的镜像作为解码器,整体构成自编码器对目标域进行预训练,使用均方误差MSE作为自编码器的重建损失函数;
(3)在正式训练阶段,源域和目标域均采用上述神经网络作为基本网络结构,源域网络还包含一个分类层,分类层的神经元数量为细胞类型的数量,使用交叉熵(cross-entropy)作为源域网络的分类损失函数。
5.根据权利要求1所属的基于深度网络自适应的scRNA-seq细胞类型识别方法,其特征在于优化网络框架阶段:
(1)在源域网络和目标网络的第二个全连接层后加入自适应层;
(2)自适应度量方法采用多核MMD(MK-MMD),它度量源域和目标域在再生希尔伯特空间RKHS中数据分布的距离,MK-MMD的平方公式定义为:
与特征映射φ相关联的特征核定义为:
k(Xs,Xt)=φ(Xs),φ(Xt)
其多核表示形式为多个PSD核{ku}的凸组合:
(3)通过最小化MK-MMD实现源域和目标域的数据分布对齐。
6.根据权利要求1所属的基于深度网络自适应的scRNA-seq细胞类型识别方法,其特征在于能够准确识别未知scRNA-seq数据集的细胞类型,将源数据集和目标数据集通过PyTorch自带的DataLoder分为多个mini-batch作为输入训练和优化网络,优化目标由两部分组成:分类损失和自适应损失,最终训练好的目标域网络作为分类器对目标数据集的类型进行准确识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111471768.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种模块化激光共聚焦显微成像装置
- 下一篇:神经患者口腔清洁护理器





