[发明专利]基于单细胞Hi-C数据的细胞类型预测系统有效
申请号: | 202110362899.1 | 申请日: | 2021-04-02 |
公开(公告)号: | CN113160886B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 吴昊;周冰;董记华 | 申请(专利权)人: | 山东大学 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B40/00;G06N3/0464;G06N3/048;G06F18/214;G06F18/23213;G06F18/24 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李圣梅 |
地址: | 250101 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 单细胞 hi 数据 细胞 类型 预测 系统 | ||
1.基于单细胞Hi-C数据的细胞类型预测系统,其特征是,包括:
数据处理模块,被配置为:对于单细胞Hi-C数据集,将细胞的每一条染色体按照预先设置的分辨率分成若干个不重叠的bins片段,然后根据数据中的序列对信息进行匹配,从而每一个细胞的每一条染色体构成一个接触矩阵;
神经网络模块,被配置为:对数据预处理模块处理后的接触矩阵输入至模型进行训练,直至模型训练完成,用训练完的模型根据输入样本来输出预测结果的细胞类型;
所述神经网络模块,包括输入层、两个隐藏层和一个输出层;
其中输入层用于接受神经网络模型的输入即单细胞Hi-C接触矩阵;
其中输出层产生神经网络模型的输出,该输出为大小是一行四列的向量,其中值最大为第几列表示预测结果为第几类;
其中隐藏层被用于学习数据集的特征信息,通过训练和修改模型的参数来最终完成学习任务;
所述神经网络模块中,ReLU激活函数用于隐藏层解决深度神经网络的非线性问题,Sigmoid激活函数用于输出模型预测结果的细胞类型。
2.如权利要求1所述的基于单细胞Hi-C数据的细胞类型预测系统,其特征是,所述数据处理模块,还包括:将每一个染色体的Hi-C接触矩阵整合成为单细胞Hi-C矩阵,该矩阵的行是细胞,列为表示一个细胞所有特征信息的接触信息。
3.如权利要求1所述的基于单细胞Hi-C数据的细胞类型预测系统,其特征是,单细胞Hi-C数据集中,根据细胞质量文件中的指标筛选符合一定条件的细胞,以确保单细胞Hi-C数据中的细胞均为有效且可用。
4.如权利要求1所述的基于单细胞Hi-C数据的细胞类型预测系统,其特征是,数据处理模块针对单细胞Hi-C数据处理时,包括:
首先,给定一条已知长度的染色体,按照预设的分辨率分成n段,每一段记做一个seg,即每一个seg长度为r;
其次,根据相互作用对文件中每一个read对的信息,统计并构造每条染色体的接触矩阵;
最后,由接触矩阵经过卷积平滑和重启随机游走处理产生矩阵Q。
5.如权利要求1所述的基于单细胞Hi-C数据的细胞类型预测系统,其特征是,构造每条染色体的接触矩阵时,每一个read都有开始位和结束位,根据其开始位和结束位的平均值确定对应的seg,统计每一对seg对应的read对的数量;
根据染色体中得到的seg之间相互作用程度,每一条染色体的Hi-C数据构造接触矩阵,其中矩阵元素表示染色体两个对应的seg之间支持相互作用的read对数量。
6.如权利要求1所述的基于单细胞Hi-C数据的细胞类型预测系统,其特征是,所述数据处理模块,还包括:
对每一条染色体的接触矩阵用一个卷积核遍历一遍,对于每一个矩阵元素用其周围元素的平均值来表示以实现平滑操作;
其次使用随机游走方法结合全局信息和局部信息;
最后在保证特征信息不丢失的基础上,用PCA技术降低细胞样本的维度。
7.基于单细胞Hi-C数据的细胞类型预测装置,基于服务器实现,其特征是,所述服务器被配置为执行以下步骤:
对于单细胞Hi-C数据,将一条染色体按照预先设置的分辨率分成若干个不重叠的bins,然后对信息进行匹配,构成接触矩阵;
对处理后的接触矩阵输入至神经网络模型进行训练,直至模型训练完成,用训练完的模型根据输入样本来输出预测结果的细胞类型;
所述神经网络模型中,ReLU激活函数用于隐藏层解决深度神经网络的非线性问题,Sigmoid激活函数用于输出模型预测结果的细胞类型。
8.如权利要求7所述的基于单细胞Hi-C数据的细胞类型预测装置,其特征是,所述神经网络模型,包括输入层、两个隐藏层和一个输出层;
其中输入层用于接受神经网络模型的输入即单细胞Hi-C接触矩阵;
其中输出层产生神经网络模型的输出,该输出为大小是一行四列的向量,其中值最大为第几列表示预测结果为第几类;
其中隐藏层被用于学习数据集的特征信息,通过训练和修改模型的参数来最终完成学习任务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110362899.1/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置