[发明专利]基于二代测序技术筛选的骨骼肌早期损伤时间推断基因集合体系获取方法及模型构建方法在审
申请号: | 202310294828.1 | 申请日: | 2023-03-24 |
公开(公告)号: | CN116364310A | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 王亮亮;周世栋;孙浩;邢运虹;孙乐乐;申君毅;任康;杜秋香;曹洁;孙俊红 | 申请(专利权)人: | 山西医科大学 |
主分类号: | G16H70/60 | 分类号: | G16H70/60;G16H50/20;G16B20/30;G16B30/10;G16B40/20 |
代理公司: | 太原科卫专利事务所(普通合伙) 14100 | 代理人: | 李晓娟 |
地址: | 030606 山*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 二代 技术 筛选 骨骼肌 早期 损伤 时间 推断 基因 集合 体系 获取 方法 模型 构建 | ||
1.基于二代测序技术筛选的骨骼肌早期损伤时间推断基因集合体系获取方法,其特征在于,包括如下步骤:
①收集不同损伤时间的大鼠骨骼肌挫伤样本,从组织中提取总RNA,利用二代测序技术进行样本深度测序,通过原始下机数据处理后,获取原始表达谱;
②对原始表达谱进行综合的生物信息学分析:通过加权基因共表达网络分析、差异基因表达分析、时间依赖性基因表达分析获取各自的核心基因集合,并预测相应的转录因子编码基因,获得各自的转录因子基因;
③多个原始表达谱进行合并,去批次效应处理,获得新数据集;
④将加权基因共表达网络分析的核心基因集合与新数据集的交集基因作为集合A;
将加权基因共表达网络分析的转录因子集合与新数据集的交集基因作为集合D;
将差异基因表达分析的核心基因集合与新数据集的交集基因作为集合B;
将差异基因表达分析的转录因子集合与新数据集的交集基因作为集合E;
将时间依赖性基因表达分析的核心基因集合与新数据集的交集基因作为集合C;
将时间依赖性基因表达分析的转录因子集合与新数据集的交集基因作为集合F。
2.根据权利要求1所述的基于二代测序技术筛选的骨骼肌早期损伤时间推断基因集合体系获取方法,其特征在于,在进行加权基因共表达网络分析获取核心基因集合时,选择与每个损伤时间点正相关性最强的模块,然后选择正相关性最强的模块内连接度排名靠前的基因作为核心基因集合。
3.根据权利要求1所述的基于二代测序技术筛选的骨骼肌早期损伤时间推断基因集合体系获取方法,其特征在于,在进行差异基因表达分析获取核心基因集合时,筛选出相邻时间点间差异基因进行PPI分析,在相邻时间点间差异基因中选择每个PPI网络中degree排名靠前的基因作为核心基因集合。
4.根据权利要求1所述的基于二代测序技术筛选的骨骼肌早期损伤时间推断基因集合体系获取方法,其特征在于,在进行时间依赖性基因表达分析获取核心基因集合时,筛选出时序性相关基因进行PPI分析,在时序性相关基因中选择每个PPI网络中degree排名靠前的基因作为核心基因集合。
5.基于二代测序技术筛选的骨骼肌早期损伤时间推断基因集合体系的模型构建方法,其特征在于,利用权利要求1所述基于二代测序技术筛选的骨骼肌早期损伤时间推断基因集合体系获取方法获得六组基因集合,分别建立多个机器学习数学模型,对各个机器学习数学模型的指标进行判断,确定最佳的机器学习数学模型。
6.根据权利要求5所述的基于二代测序技术筛选的骨骼肌早期损伤时间推断基因集合体系的模型构建方法,其特征在于,多个机器学习数学模型包括随机森林、支持向量机、多层感知器。
7.根据权利要求5所述的基于二代测序技术筛选的骨骼肌早期损伤时间推断基因集合体系的模型构建方法,其特征在于,所述指标包括准确率、精确率、召回率和F1分数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西医科大学,未经山西医科大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310294828.1/1.html,转载请声明来源钻瓜专利网。