[发明专利]一种生物样本完备性的评价方法有效
申请号: | 201110247951.5 | 申请日: | 2011-08-24 |
公开(公告)号: | CN102289601A | 公开(公告)日: | 2011-12-21 |
发明(设计)人: | 葛维挺;黄彦钦;郑树;周小宇 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00;G06F17/30 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 张法高;赵杭丽 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种生物样本完备性的评价方法,通过在储存子系统中保存样本实物和样本资料,在评分子系统中计算每个病例的实物完备性和资料完备性,以分别反映实物库存和信息库存,并将两者以二次函数的关系合并作为生物样本整体完备性的量化评价指标,最后在检索子系统中为用户提供按完备性排序的样本列表。本发明优先使用符合用户需求的低价值病例的样本,保留超出用户需求的高完备性的样本,提高了生物样本和样本库的利用效率。本发明的评分字段,其分值由该字段在病例中出现的次数计算而来,天然反映了相应病例的稀缺和重要程度,并且随着新样本的入库和资料的更新,评分指标的分值也随之更新,具备了客观、量化、全面、动态更新的优点。 | ||
搜索关键词: | 一种 生物 样本 完备 评价 方法 | ||
【主权项】:
一种生物样本完备性的评价方法,是在一个生物样本库系统中依次按照以下步骤实现的:(1)在储存子系统中保存样本实物和样本资料,在存储子系统中列出样本库中所有待评价病例为集合P,统计病例总数为N,列出与样本实物相关的字段Wi为集合S,列出与样本资料相关的字段Wi为集合D,统计病例集合中所有包含字段Wi的病例总数,表示为df(Wi);(2)在评分子系统中,针对集合S,计算字段Wi和病例p的相关性评分ScoreI(p,Wi),评分公式为: ScoreI ( p , Wi ) = C ( Wi , p ) × log ( N / df ( Wi ) + k ) Σ Wi ∈ S [ C ( Wi , p ) × log ( N / df ( Wi ) + k ) ] 2 , 其中C(Wi,p)是字段Wi在病例p中出现的次数,k是一个0.01到1之间的常数,Wi∈S是与样本实物相关的集合S中的每个字段,然后将集合S中的所有Wi的评分相加,得到病例p的实物评分ScoreS(p,S),评分公式为: ScoreS ( p , S ) = Σ Wi ∈ S ScoreI ( p , Wi ) ; (3)在评分子系统中,针对集合D,计算字段Wi和病例p的相关性评分ScoreI(p,Wi),评分公式为: ScoreI ( p , Wi ) = C ( Wi , p ) × log ( N / df ( Wi ) + k ) Σ Wi ∈ D [ C ( Wi , p ) × log ( N / df ( Wi ) + k ) ] 2 , 其中C(Wi,p)是字段Wi在病例p中出现的次数,k是一个0.01到1之间的常数,Wi∈D是与样本资料相关的集合D中的每个字段,然后将集合D中的所有Wi的评分相加,得到病例p的实物评分ScoreD(p,D),评分公式为: ScoreD ( p , D ) = Σ Wi ∈ D ScoreI ( p , Wi ) ; (4)在评分子系统中将病例p的实物评分和资料评分基于二次函数合并作为最终的完备性评分Value(p),计算公式为:Value(p)=ScoreS(p,S)×ScoreD(p,D);(5)在储存子系统中按完备性评分高低从小到大对病例排序,同一病例所属样本的完备性评分相同,用户输入关键词搜索样本,检索子系统对符合要求的样本按此顺序列出以供判断和选择。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110247951.5/,转载请声明来源钻瓜专利网。
- 上一篇:饭卡管理系统
- 下一篇:在线应用搜索方法及系统
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用