[发明专利]一种生物样本完备性的评价方法有效
申请号: | 201110247951.5 | 申请日: | 2011-08-24 |
公开(公告)号: | CN102289601A | 公开(公告)日: | 2011-12-21 |
发明(设计)人: | 葛维挺;黄彦钦;郑树;周小宇 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00;G06F17/30 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 张法高;赵杭丽 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 生物 样本 完备 评价 方法 | ||
技术领域
本发明属于生物样本保存和利用技术领域,具体涉及一种在生物样本库系统中对样本完备性进行评价的方法。
背景技术
生物样本是生命科学与医药研发领域的必备基础和来源,用于诊断标志物筛选和治疗药物研发等研究。生物样本包含丰富的遗传信息、疾病进展信息、对治疗的反应信息等,且具有不可再生性,规范保存和利用的生物样本已成为该领域最宝贵的资源,是实现科研成果快速产业化、实现“转化医学”研究目标的重要保证。在遵循医学伦理规范的前提下,国内外已经建立了各类不同规模的生物样本库,特别是恶性肿瘤、心脑血管和血液病等各类重大疾病的生物样本库。生物样本库不仅需要保存核酸、蛋白质、细胞、石蜡保存组织、冻存组织和体液等实物,而且需要记录相关的临床、病理、检验、影像、随访和样本调用等资料。建立生物样本库不仅仅是一项简单的收集工作,而是要通过储存和使用样本参与临床和科学研究,来实现生物样本的医疗健康意义或某种经济目的。
生物样本对研究的贡献实现于样本被使用那一刻,在保存过程中难以评价其潜在贡献大小。生物样本的保存尽管尚无明确标准,但一般要求是:对于血液样本要有患者姓名、性别、年龄、疾病种类等基本资料;对于组织样本还要有病理资料。同时认为生物样本越齐全越好,包括1)生物样本的实物和资料,如一例肿瘤样本有血液、冻存组织、石蜡包埋组织等类型,有临床资料、病理资料和检验资料,好于仅有一管血液样本和临床资料的病例;2)患者病情的跟踪随访,如计算患者的生存期必须要有随访资料;3)获得样本的分子生物学信息,如疾病相关基因的突变检测;4)难以取得的样本和资料,如早期肿瘤或低发病率的疾病。高水平研究项目通常要求多种形式的样本实物和齐全的样本资料,实物和资料的齐全程度(可称之为完备性)反映了样本可用于研究的潜在贡献大小。
现在的生物样本库系统实现了样本的分类和定位、资料的存储和更新、样本存放和取出等功能,用户调用样本过程为:向样本检索系统输入关键词;系统列出包含关键词的样本;用户从中选择样本用于研究。这些样本的确符合用户需求,但其中也包含了超出用户需求的样本。这种样本调用方法容易导致两种尴尬局面:(1)符合高水平科研项目要求的生物样本可能被用于低水平的项目,(2)仅能用于低水平项目的生物样本占用昂贵的储存空间,造成了宝贵样本和储存空间的双重浪费。
与样本检索流程比较,在文档的信息检索领域中,用户搜索目的文档的流程如下:向检索系统输入关键词;检索系统列出候选文档/网页;使用TF*IDF等方法计算这些文档和用户关键词之间的相关程度;按相关程度列出最符合用户期望的文档。与文档检索比较样本检索具有以下不同之处:(1)不仅要列出符合本次检索关键词的结果,而且要区分这些结果中那些超出本次检索要求,以及超出的程度;(2)样本检索的关键词既有对应样本实物的,也有对应样本资料的,样本用于研究需要有实物,没有实物的话资料再多也无用,反之也是;(3)部分字段涉及样本库的质量、数量或有效期等控制条件,不适合用于评价样本完备性;(4)与文档相比,样本库的字段设置和保存相对规范,有利于检索和评价。
最大的不同之处,文档可以无限拷贝,生物样本却不可再生,这就要求我们必须解决生物样本的评价问题,为用户提供合格且合适的样本,保留超出用户需求的样本,用于更高要求的研究。
发明内容
本发明提供一种在生物样本库系统中对样本完备性进行评价的方法,通过在储存子系统中保存样本实物和样本资料,在评分子系统中计算每个病例的实物完备性和资料完备性,以分别反映实物库存和信息库存,并将两者以二次函数的关系合并作为生物样本整体完备性的量化评价指标,最后在检索子系统中为用户提供按完备性排序的样本列表,以便对完备性不同的生物样本采取相应的策略。
本发明方法是在一个生物样本库系统中依次按照以下步骤实现的:
(1)在储存子系统中保存样本实物和样本资料;在存储子系统中列出样本库中所有待评价病例为集合P,统计病例总数为N;列出与样本实物相关的字段Wi为集合S;列出与样本资料相关的字段Wi为集合D;统计病例集合中所有包含字段Wi的病例总数,表示为df(Wi);
在进行步骤(1)前先列出停用病例集合nP和停用字段集合nW,这些集合中的病例和字段不用于后续计算。
(2)在评分子系统中,针对集合S,计算字段Wi和病例p的相关性评分ScoreI(p,Wi),评分公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110247951.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:饭卡管理系统
- 下一篇:在线应用搜索方法及系统
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用