[发明专利]单细胞表现型数据库系统和搜索引擎有效
申请号: | 201310105207.0 | 申请日: | 2013-03-29 |
公开(公告)号: | CN104077307B | 公开(公告)日: | 2017-08-29 |
发明(设计)人: | 任立辉;宁康;籍月彤;王允;徐健;黄巍 | 申请(专利权)人: | 中国科学院青岛生物能源与过程研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266101 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | “单细胞表现型数据库系统和搜索引擎”是针对目前国内很少有相关的单细胞表现型数据库和基于单细胞表现型数据库的搜索引擎,从而很难进行单细胞表型研究的问题,提出一种单细胞表现型数据库系统和搜索引擎方法。单细胞表现型数据库系统和搜索引擎的主要模块由单细胞表现型数据库和搜索引擎两部分组成。(1)单细胞表现型数据库系统,适应于存储单细胞的拉曼光谱数据和单细胞图像。核心是两层数据库结构和相应的数据处理方法。(2)基于单细胞表现型数据库的搜索引擎。搜索引擎可以将某个未知细胞的拉曼光谱数据和细胞图像作为查询数据,通过搜索整个单细胞表现型数据库并找出最佳匹配细胞,从而获取此未知细胞的详细信息。 | ||
搜索关键词: | 单细胞 表现型 数据库 系统 搜索引擎 | ||
【主权项】:
一种单细胞表现型数据搜索系统,其特征是:所述搜索系统包括单细胞表现型数据库和搜索引擎,单细胞表现型数据库中包括单细胞图像、细胞光谱数据、细胞培养条件、测试条件,搜索引擎是以某个未知细胞的拉曼光谱数据或细胞图像作为查询数据,通过比对整个单细胞表现型数据库并找出最佳匹配细胞,从而获取此未知细胞的详细信息;所述单细胞表现型数据库是两层数据库结构,初级数据库中存储来源于单细胞拉曼信号采集设备和单细胞图像采集设备的原始数据,并记录单细胞光谱和图像信息;核心数据库中存储来源于原始数据的,通过归一化和质量控制处理的,具有特定类型物种代表性的单细胞数据;归一化和质量控制通过拉曼图谱分析模块完成,所述分析模块通过对光谱信号和单细胞图像进行数据分析,筛选出具有代表性的单细胞数据并存入核心数据库中;代表性单细胞数据的筛选,通过基于所有单细胞聚类分析中的组间差异和组内差异分析来获得;特定物种特定环境特定采集时间的单细胞数据均选出代表性高质量数据存储于核心数据库中;核心数据库还将和NCBI、MG‑RAST通用或专业功能基因组数据库连接,支撑单细胞基因型和表观型的整合分析;单细胞表现型数据库提供基因组接口,来实现细胞拉曼光谱数据、单细胞图像数据与基因组数据的相互转换;通过此接口,由细胞的拉曼光谱数据来获得相应的基因组数据,或通过基因组数据来获得此细胞数据库中所存储的拉曼光谱数据和图像数据,基于基因组接口进行特征峰选取和分析、拉曼图谱比较和聚类、表观型生物标记鉴定、基因型‑表观型整合的分析流程;在搜索数据库时,采取并行化的策略将整个数据库分割为多个子块并同时进行比对,然后将子块的比对结果整合起来,即可获得整个数据库的最佳匹配;在进行数据库分割时,将整个数据库以细胞为最小单位分割成一些数据量较小的子块,整个数据库的每个子块都是相对独立的,彼此之间的搜索比对互不影响;对于大规模数据的整合,利用归并算法:设定一个阈值,如果数据库子块的数量超过此阈值,那么将这些需要整合的数据再次拆分并且并行化进行整合,直到需要整合的数据数量低于所设定的阈值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院青岛生物能源与过程研究所,未经中国科学院青岛生物能源与过程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310105207.0/,转载请声明来源钻瓜专利网。
- 上一篇:加载资源文件的方法、设备和系统
- 下一篇:一种搜索引擎的结果排序方法及系统