[发明专利]分析生物基因组基因表达、拷贝数变异的可视化方法在审
申请号: | 201710266658.0 | 申请日: | 2017-04-21 |
公开(公告)号: | CN107169314A | 公开(公告)日: | 2017-09-15 |
发明(设计)人: | 宋凯;毕家豪 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F19/26 | 分类号: | G06F19/26 |
代理公司: | 天津市北洋有限责任专利代理事务所12201 | 代理人: | 宋洁瑾 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种分析生物基因组基因表达、拷贝数变异的可视化方法,每个染色体的所有基因,按照每个基因的起始位置作为横坐标,用matlab软件中的独立样本检验函数ttest2,每个基因会得到一个P值,然后对P值进行处理,然后规定两组样本的颜色,确定Y轴朝向,用matlab中的line函数绘制线,确定百分比值。本发明的可视化方法,在两种癌症类型下进行基因表达量或者拷贝数变异对比的时候,或者在同一个癌症类型下正常类型样本和肿瘤类型样本的基因表达量或者拷贝数变异对比的时候可以直观的反映哪种类型的癌症或者哪种类型样本的值大;对于基因表达量,高级曼哈顿图可以直观显示出基因是过表达呢还是表达不足;对于拷贝数变异,高级曼哈顿图可以直观显示出基因是扩增还是丢失。 | ||
搜索关键词: | 分析 生物 基因组 基因 表达 拷贝 变异 可视化 方法 | ||
【主权项】:
一种分析生物基因组基因表达、拷贝数变异的可视化方法,其特征在于,包括以下步骤:(1)横纵坐标的确定:把每个染色体的所有基因,按照每个基因的起始位置作为横坐标;用matlab软件中的独立样本检验函数ttest2,然后每个基因会得到一个P值,然后对P值进行处理,‑10log10(P)这个值始终是正的,我们将这个值作为纵坐标的幅度值;(2)颜色的确定:事先需要规定两组样本的颜色,然后用matlab中的中位数函数,遍历出这两组样本中每个基因的拷贝数的中位数值,然后比较每个基因的两个中位数,谁的中位数值大,则颜色就取规定的该中位数所属组的颜色;(3)Y轴朝向的确定:在找到每个基因拷贝数中位数值大的所属的样本组后,拿这个大的基因拷贝数值中位数和该组所属的癌症类型中的正常样本的基因拷贝数中位数值做差,做差后的结果,如果值是正值则纵轴方向朝上,如果值是负值则纵轴方向朝下;(4)绘制线:用matlab中的line函数;(5)垂直虚线:因为中心体也有具体的位置,同样可以用line函数,把虚线绘制出来;(6)百分比值的确定:用Bonferonni校正的p值为2*10的‑6次,做水平虚线,然后计算每个染色体中的p臂或者q臂中,P值大于那条水平虚线阈值的基因个数占该染色体整个p臂或者q臂的比例。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710266658.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种盐渍毛肚的护脆方法
- 下一篇:一种生姜的沙湿储存方法
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用