[发明专利]基于单细胞Hi-C数据的细胞类型预测系统有效

专利信息
申请号: 202110362899.1 申请日: 2021-04-02
公开(公告)号: CN113160886B 公开(公告)日: 2023-04-07
发明(设计)人: 吴昊;周冰;董记华 申请(专利权)人: 山东大学
主分类号: G16B20/30 分类号: G16B20/30;G16B40/00;G06N3/0464;G06N3/048;G06F18/214;G06F18/23213;G06F18/24
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 李圣梅
地址: 250101 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 单细胞 hi 数据 细胞 类型 预测 系统
【权利要求书】:

1.基于单细胞Hi-C数据的细胞类型预测系统,其特征是,包括:

数据处理模块,被配置为:对于单细胞Hi-C数据集,将细胞的每一条染色体按照预先设置的分辨率分成若干个不重叠的bins片段,然后根据数据中的序列对信息进行匹配,从而每一个细胞的每一条染色体构成一个接触矩阵;

神经网络模块,被配置为:对数据预处理模块处理后的接触矩阵输入至模型进行训练,直至模型训练完成,用训练完的模型根据输入样本来输出预测结果的细胞类型;

所述神经网络模块,包括输入层、两个隐藏层和一个输出层;

其中输入层用于接受神经网络模型的输入即单细胞Hi-C接触矩阵;

其中输出层产生神经网络模型的输出,该输出为大小是一行四列的向量,其中值最大为第几列表示预测结果为第几类;

其中隐藏层被用于学习数据集的特征信息,通过训练和修改模型的参数来最终完成学习任务;

所述神经网络模块中,ReLU激活函数用于隐藏层解决深度神经网络的非线性问题,Sigmoid激活函数用于输出模型预测结果的细胞类型。

2.如权利要求1所述的基于单细胞Hi-C数据的细胞类型预测系统,其特征是,所述数据处理模块,还包括:将每一个染色体的Hi-C接触矩阵整合成为单细胞Hi-C矩阵,该矩阵的行是细胞,列为表示一个细胞所有特征信息的接触信息。

3.如权利要求1所述的基于单细胞Hi-C数据的细胞类型预测系统,其特征是,单细胞Hi-C数据集中,根据细胞质量文件中的指标筛选符合一定条件的细胞,以确保单细胞Hi-C数据中的细胞均为有效且可用。

4.如权利要求1所述的基于单细胞Hi-C数据的细胞类型预测系统,其特征是,数据处理模块针对单细胞Hi-C数据处理时,包括:

首先,给定一条已知长度的染色体,按照预设的分辨率分成n段,每一段记做一个seg,即每一个seg长度为r;

其次,根据相互作用对文件中每一个read对的信息,统计并构造每条染色体的接触矩阵;

最后,由接触矩阵经过卷积平滑和重启随机游走处理产生矩阵Q。

5.如权利要求1所述的基于单细胞Hi-C数据的细胞类型预测系统,其特征是,构造每条染色体的接触矩阵时,每一个read都有开始位和结束位,根据其开始位和结束位的平均值确定对应的seg,统计每一对seg对应的read对的数量;

根据染色体中得到的seg之间相互作用程度,每一条染色体的Hi-C数据构造接触矩阵,其中矩阵元素表示染色体两个对应的seg之间支持相互作用的read对数量。

6.如权利要求1所述的基于单细胞Hi-C数据的细胞类型预测系统,其特征是,所述数据处理模块,还包括:

对每一条染色体的接触矩阵用一个卷积核遍历一遍,对于每一个矩阵元素用其周围元素的平均值来表示以实现平滑操作;

其次使用随机游走方法结合全局信息和局部信息;

最后在保证特征信息不丢失的基础上,用PCA技术降低细胞样本的维度。

7.基于单细胞Hi-C数据的细胞类型预测装置,基于服务器实现,其特征是,所述服务器被配置为执行以下步骤:

对于单细胞Hi-C数据,将一条染色体按照预先设置的分辨率分成若干个不重叠的bins,然后对信息进行匹配,构成接触矩阵;

对处理后的接触矩阵输入至神经网络模型进行训练,直至模型训练完成,用训练完的模型根据输入样本来输出预测结果的细胞类型;

所述神经网络模型中,ReLU激活函数用于隐藏层解决深度神经网络的非线性问题,Sigmoid激活函数用于输出模型预测结果的细胞类型。

8.如权利要求7所述的基于单细胞Hi-C数据的细胞类型预测装置,其特征是,所述神经网络模型,包括输入层、两个隐藏层和一个输出层;

其中输入层用于接受神经网络模型的输入即单细胞Hi-C接触矩阵;

其中输出层产生神经网络模型的输出,该输出为大小是一行四列的向量,其中值最大为第几列表示预测结果为第几类;

其中隐藏层被用于学习数据集的特征信息,通过训练和修改模型的参数来最终完成学习任务。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110362899.1/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top