[发明专利]数据处理方法及装置有效
申请号: | 201711455784.7 | 申请日: | 2017-12-27 |
公开(公告)号: | CN108346468B | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 张静波;王见收;刘珂弟;刘倩;唐宇 | 申请(专利权)人: | 北京科迅生物技术有限公司 |
主分类号: | G16H50/30 | 分类号: | G16H50/30 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 赵囡囡 |
地址: | 100037 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 | ||
本发明公开了一种数据处理方法及装置。其中,该方法包括:获取受检者与目标疾病相关的至少一个位点的基因型的集合;根据每个位点的基因型对应的优势比OR的值计算受检者罹患目标疾病的基因型风险概率;获取受检者的外界因素集,其中,外界因素集包括与目标疾病相关的至少一个人体特征的值;根据每个人体特征的值计算受检者罹患目标疾病的环境风险概率;根据基因型风险概率和环境风险概率计算受检者罹患目标疾病的综合风险概率。本发明解决了相关技术未考虑同变异在人群中频率分布、年龄、性别等环境因素对疾病风险的影响的技术问题。
技术领域
本发明涉及疾病风险控制技术领域,具体而言,涉及一种数据处理方法及装置。
背景技术
相关技术中,在全球慢病发病率越来越高,基因检测成本越来越低,基因检测也越来越普及,疾病易感筛查项目也应运而生,但对于疾病易感风险准确评估的方法却了了无几,主要为以下方法:
1、每个疾病选小于10个的相关位点,根据文献记录信息人为的给每个位点权重,最终计算疾病风险(博奥-爱身谱系列产品);
2、所有与疾病相关位点的OR值相乘作为疾病风险(圣谷同创-易感类产品)。
通过贝叶斯概率理论综合计算疾病风险(23andme),大部分文献中只记录了风险变异基因型的OR(Odds Ratio优势比)值,未给出每种基因型的OR值;相关部分技术采用人为处理补齐(例如23andme人为的设定纯合变异的OR为杂合变异OR值的平方,野生型变异OR人为设定为1)未考虑到不同变异在人群中频率分布对于疾病风险评估的最终影响;另外,相关技术未考虑年龄、性别等环境因素对疾病风险的影响;相关技术未考虑多次检测结果对于疾病风险准确性的校正。
针对相关技术未考虑同变异在人群中频率分布、年龄、性别等环境因素对疾病风险的影响的技术问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种数据处理方法及装置,以至少解决相关技术未考虑同变异在人群中频率分布、年龄、性别等环境因素对疾病风险的影响的技术问题。
根据本发明实施例的一个方面,提供了一种数据处理方法,该方法包括:获取受检者与目标疾病相关的至少一个位点的基因型的集合;根据每个位点的基因型对应的优势比OR的值计算所述受检者罹患所述目标疾病的基因型风险概率;获取所述受检者的外界因素集,其中,所述外界因素集包括与所述目标疾病相关的至少一个人体特征的值;根据每个人体特征的值计算所述受检者罹患所述目标疾病的环境风险概率;根据所述基因型风险概率和所述环境风险概率计算所述受检者罹患所述目标疾病的综合风险概率。
进一步地,根据每个位点的基因型对应的优势比OR的值计算所述受检者罹患所述目标疾病的基因型风险概率包括:获取第i个位点的基因型对应的OR值OR(m,i),其中,m∈(AA,Aa,aa),AA代表纯合型变异,Aa代表杂合型变异,aa代表野生型变异;获取样本中的人群频率AFm;通过以下公式对每个位点的基因型对应的OR值进行校正,得到第i个位点的基因型对应的校正后的OR值
通过以下公式计算所述至少一个位点的联合OR值ORG:
其中,n为所述至少一个位点的个数;
通过以下公式计算在所述受检者的基因型集为G的情况下罹患所述目标疾
病D的基因型风险概率Pr(D|G):
ORG=odds(D|G)/odds(D),其中,odds(X)=Pr(X)/[1-Pr(X)],
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科迅生物技术有限公司,未经北京科迅生物技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711455784.7/2.html,转载请声明来源钻瓜专利网。