[发明专利]基于单细胞Hi-C数据的细胞类型预测系统有效
申请号: | 202110362899.1 | 申请日: | 2021-04-02 |
公开(公告)号: | CN113160886B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 吴昊;周冰;董记华 | 申请(专利权)人: | 山东大学 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B40/00;G06N3/0464;G06N3/048;G06F18/214;G06F18/23213;G06F18/24 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李圣梅 |
地址: | 250101 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 单细胞 hi 数据 细胞 类型 预测 系统 | ||
本公开提出了基于单细胞H i‑C数据的细胞类型预测系统,包括:数据预处理模块,被配置为:对于单细胞H i‑C数据,将一条染色体按照预先设置的分辨率分成若干个不重叠的b i ns,然后对信息进行匹配,构成接触矩阵;神经网络模块,被配置为:对数据预处理模块处理后的接触矩阵进行处理,输出模型预测结果的四种细胞类型。该预测模型能够应用于对未知类型的细胞测序数据进行细胞类型预测。
技术领域
本公开属于计算机数据处理技术领域,尤其涉及基于单细胞Hi-C数据的细胞类型预测系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
最早,各种DNA测序技术由化学降解法、双脱氧链终止法等传统的测序方法发展而来,但是由于早期仪器技术的不发达而导致传统的DNA测序技术存在一些缺陷:误差过大、方法过于复杂且无法重复测定等。随着人们对大规模基因组测序的需求提高,这些早期的DNA测序技术因无法做到对基因组的深度测序和重复测序而被慢慢淘汰。
为了实现大规模基因组的测序,研究人员研发了一种新的测序方法—Hi-C。Hi-C技术由已被广泛应用的3C、4C技术作为基础,依靠高通量测序技术成功地揭示了细胞内染色体间的互相作用信息,是一种功能强大,低成本且被广泛应用的方法。然而Hi-C技术存在一定的缺陷:须要输入的细胞数量高达数百万个,并且由于细胞之间基因组组织的变化,只能提供基因组构象的总体平均值。
单细胞研究方法促进了我们对细胞类型异质性的理解,其中从传统的 RNA-seq测序技术演变而来的单细胞RNA-seq技术已经较为全面且被广泛应用了,从而单细胞技术在Hi-C测序技术上得以应用。研究人员提出了一个新的测序方法——单细胞Hi-C技术,能够使用单细胞Hi-C测序得到每个细胞详细的实时表达谱。先前的Hi-C测序方法是从数百万个细胞中平均地确定染色体构造,单细胞Hi-C技术则是将其转变为从单个细胞中确定染色体和基因组结构,并且具有检测单个细胞中数千个同步染色质相互作用的能力。一般而言,在用单细胞Hi-C技术检测细胞的相互作用信息时,产生的相互作用图谱很稀疏,但是这些互作用数据提供了有用的信息,有助于了解核基因组组织和染色体结构中的细胞变异性。单细胞染色体构造的简要说明信息可能反映了它们的动态行为。在对单细胞染色体结构的说明信息进行分析时,这些数据提供了一定的可能性,而且单细胞技术具有捕获细胞异质性的能力。稀疏的单细胞Hi-C数据被数学计算方面的方法处理后,被用于分子生物学方向的研究人员进一步地使用和分析,因此有关单细胞 Hi-C数据的计算分析方法对促进生物学的研究是有必要的。
细胞类型预测是基因组学中细胞类型鉴定和药物开发的关键,可以解决生物学实验中细胞分类的困难和耗时问题。
在以往的研究中,医疗上的各种细胞分类问题皆是采用图像处理技术和模式识别等技术实现,例如对白细胞的分类和计数。而这些方法技术都是基于图像层面的,这些方法都存在一些常见问题,细胞图像的分割的精确与否,直接影响到特征提取和分类的准确性。目前还未有在细胞染色体结构层面的准确的细胞分类方法,单细胞Hi-C技术能够分辨单个染色体的构象模型,并阐明染色体的相互作用以及基因组功能的受控机制,适用于稀少细胞以及处于特殊形态细胞的染色体功能构象解析,现在仍缺乏基于单细胞Hi-C数据的方便准确的细胞类型预测方法。
发明内容
为克服上述现有技术的不足,本公开提供了基于单细胞Hi-C数据的细胞类型预测系统,能够应用于对未知类型的细胞测序数据进行细胞类型预测。
为实现上述目的,本公开的一个或多个实施例提供了如下技术方案:
第一方面,公开了基于单细胞Hi-C数据的细胞类型预测系统,包括:
数据处理模块,被配置为:对于单细胞Hi-C数据集,将细胞的每一条染色体按照预先设置的分辨率分成若干个不重叠的bins片段,然后根据数据中的序列对信息进行匹配,从而每一个细胞的每一条染色体构成一个接触矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110362899.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置