[发明专利]一种基于宏基因组的人腺病毒分子分型和溯源方法及系统有效
申请号: | 202110082315.5 | 申请日: | 2021-01-21 |
公开(公告)号: | CN112687344B | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 夏涵 | 申请(专利权)人: | 予果生物科技(北京)有限公司;西咸新区予果微码生物科技有限公司;予果智造科技(北京)有限公司 |
主分类号: | G16B50/00 | 分类号: | G16B50/00;G16B30/00;G16B40/00 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 吴金水 |
地址: | 100000 北京市东城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于宏基因组的人腺病毒分子分型和溯源方法及系统,其方法包括:构建包含分型层级分类系统的人腺病毒分型数据库,获取人腺病毒的分类单元和完整基因组/标记基因序列,确定人腺病毒每个分类单元的完整基因组/标记基因序列,获取临床样本的宏基因组测序原始数据,对其进行预处理获得目标宏基因组数据,利用预设宏基因组测序数据双重比对注释系统分析目标宏基因组数据,确定所述临床样本是否有目标人腺病毒分类单元,当确定临床样本中有目标人腺病毒分类单元时,确定目标人腺病毒分类单元对应的目标关联特征,生成人腺病毒分型鉴定报告。能够对病毒含量偏低的临床感染样本进行人腺病毒的分类单元(亚型/基因型)分型鉴定。 | ||
搜索关键词: | 一种 基于 宏基 病毒 分子 溯源 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于予果生物科技(北京)有限公司;西咸新区予果微码生物科技有限公司;予果智造科技(北京)有限公司,未经予果生物科技(北京)有限公司;西咸新区予果微码生物科技有限公司;予果智造科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110082315.5/,转载请声明来源钻瓜专利网。
- 同类专利
- 蛋白质索引的生成方法、蛋白质片段的查询方法及装置-202211352378.9
- 赵康菲;蒋彪彬 - 腾讯科技(深圳)有限公司
- 2022-10-31 - 2023-10-27 - G16B50/00
- 本申请公开了一种蛋白质索引的生成方法、蛋白质片段的查询方法及装置,属于计算机技术领域。本申请通过对每个蛋白质片段都提取拓扑结构特征,基于拓扑结构特征来将各个蛋白质片段进行粗粒度聚类,划分成多个蛋白质片段集合,再以蛋白质片段集合为单位,将集合内蛋白质片段分割形成多组子结构特征集合,对每组子结构特征集合中各个子结构特征进行细粒度聚类,划分成多个聚类子集,基于这些聚类子集的聚类中心来生成每个蛋白质片段的索引,通过使用低维空间的索引准确表征蛋白质片段,在搜索时无需线性扫描,降低了计算开销,提升了查询效率,能够快速响应高并发的在线查询任务。
- 多线程基因数据压缩方法、装置-201911200154.4
- 刘华 - 中科曙光(南京)计算技术有限公司
- 2019-11-29 - 2023-10-27 - G16B50/00
- 本发明公开了一种多线程基因数据压缩方法、装置,包括:在待压缩基因序列中提取参考基因序列;从所述参考基因序列中获取包括参考基因序列碱基信息的数据信息;将所述参考基因序列碱基信息与待压缩基因序列碱基信息进行匹配;基于匹配结果对待压缩基因序列中的各条序列进行多线程压缩。采用上述方案,可以大幅度提升压缩率。
- 工作流生成方法、装置、计算机系统及计算机存储介质-202210311200.3
- 蒋艳凰;孙朝辉;万斌;赵丽霞;彭厘旻;康佳琪;熊亚辉;杨淼 - 人和未来生物科技(长沙)有限公司
- 2022-03-28 - 2023-10-13 - G16B50/00
- 本发明提出一种工作流生成方法、装置、计算机系统及计算机存储介质,工作流生成方法包括:获取用户定义的工作流,其中,所述工作流包括多个计算任务;根据每个所述计算任务确定对应的任务对象;为每个所述任务对象传递输入参数;根据所述输入参数的引用关系确定具有依赖关系的任务对象;根据所有所述任务对象及对应的输入参数生成可执行的工作流程序脚本;根据所述工作流程序脚本的执行顺序计算所述计算任务,可以根据实际业务需求编写计算任务,充分发挥编程语言的灵活特性,使得工作流描述变得更加方便高效。
- 一种简化碱基编辑库的guide-RNAs基因编辑工具-202310867155.4
- 岳振宇;周前;高羽佳;魏鹏程;黎珉;高皖陵;赵俊 - 安徽农业大学
- 2023-07-14 - 2023-09-29 - G16B50/00
- 本发明涉及基因编辑,具体涉及一种简化碱基编辑库的guide‑RNAs基因编辑工具,包括交互模块、目标序列简化模块和显示模块;交互模块,供用户同时搜索具有多个PAM的目标序列,并根据需要设定优先级;目标序列简化模块,基于预设简化规则对目标序列进行简化,以降低目标序列遗传位点的可重复性;显示模块,将所有符合要求的目标序列显示在页面上,供用户选择合适的目标序列;本发明提供的技术方案能够有效克服现有技术所存在的不能对包含多种原间隔邻近模序序列的碱基编辑库进行有效简化的缺陷。
- 一种基于孟德尔随机化的多因素大规模数据整合分析方法-202310662715.2
- 赵天毓;陈立;张明;李慧 - 吉林大学
- 2023-06-06 - 2023-09-29 - G16B50/00
- 本发明公开了一种基于孟德尔随机化的多因素大规模数据整合分析方法,首先收集数据,在MRCIEUOpenGWAS数据库中分别筛选出暴露变量及结局变量的GWAS数据集,其次在暴露变量的GWAS数据集中分别筛选出对应的SNPs作为工具变量用于MR研究,最后使用随机效应的逆方差加权模型作为分析方法挖掘AD潜在的风险因素。本发明通过MR模型可实现有效、快速、准确地挖掘新型AD潜在风险因素,并且可以得到相关风险因素与不同亚型AD之间的因果关联,该结果可以应用于临床生物标志物检查,为全世界生命科学家及临床专家提供AD研究的新思路,同时通过本发明得到的阿尔茨海默病风险因素筛查模型可以在其他疾病中应用推广。
- 基于多源生物数据的哈希检索方法、系统、设备和介质-202311082477.4
- 余国先;王月群;王峻 - 山东大学
- 2023-08-28 - 2023-09-29 - G16B50/00
- 本发明提出了基于多源生物数据的哈希检索方法、系统、设备和介质,涉及大规模数据检索领域,具体方案包括:利用训练好的哈希模型,分别生成待检索样本的哈希码和数据库中各样本的哈希码,所述样本为多源生物数据,包括图像和文本;基于哈希码间的汉明距离,得到检索结果;其中,所述哈希模型在训练过程中,以不同模态样本间的跨模态相似性作为监督信息,学习文本特征和图像特征间的自适应融合系数,利用自适应融合系数,用文本特征自适应增强图像特征,基于增强后的特征,生成哈希码;本发明设计了特征自适应融合模块,计算自适应融合系数,并使用文本特征自适应增强图像特征,将哈希技术引入生物数据的跨模态数据检索中。
- 一种信息处理方法、装置及设备-202310573081.3
- 肖庆宇;陈易凡;刘继龙;于鸿磊;李昭强;李召义;程瑾瑜;陈林;卢欣;孙博文;陈秭如;杨广霞;周剑文;张鑫;李亦学;谭待 - 北京火山引擎科技有限公司;广州国家实验室
- 2023-05-19 - 2023-09-29 - G16B50/00
- 本申请公开了一种信息处理方法、装置及设备,用户可在生物信息分析的工作空间中创建第一交互式文档,响应于该创建操作,在工作空间中启动和展示创建后的第一交互式文档。工作空间中展示有第一交互式分析控件,第一交互式分析控件对应有第一程序代码。用户可对第一交互式分析控件进行触发,响应于该触发操作,将第一程序代码添加到第一交互式文档中,并可以基于此继续编辑第一程序代码,获得编辑后的第一交互式文档。运行编辑后的第一交互式文档,便可获得生物信息分析结果。如此,实现了交互式文档和交互式分析控件在工作空间的集成,基于交互式文档和交互式分析控件能够降低用户进行生物信息分析的操作复杂度。
- 面向生物大数据的流式传输与变异实时挖掘系统及方法-201911347153.2
- 杨晓飞;孙雨;叶凯;蔺佳栋;段明哲;郭立 - 西安交通大学
- 2019-12-24 - 2023-09-29 - G16B50/00
- 面向生物大数据的流式传输与变异实时挖掘系统及方法,传输层读取数据层中的测序数据文件,通过生物数据流式传输算法生成测序数据流,再将测序数据流,发送给计算层;计算层接收来自传输层的实时测序读段数据,根据基于Map Reduce的删除变异实时挖掘算法,实时计算该局部测序区域是否存在删除变异并输出删除变异的左右端点,并将删除变异的左右端点传输给用户层。通过基于Map Reduce的删除变异实时挖掘算法,根据实时接收到的局部测序数据流,即可实时判断局部区域是否存在删除变异,而不需要整个基因组中的上下文信息,实现了对测序数据的解耦,降低了传统测序数据处理算法对计算资源的高要求和高依赖。
- 致病基因位点数据库及其建立方法-202010612454.X
- 刘晶星;于世辉;喻长顺 - 广州金域医学检验中心有限公司;广州金域医学检验集团股份有限公司
- 2020-06-30 - 2023-09-29 - G16B50/00
- 本发明涉及一种致病基因位点数据库及其建立方法,属于疾病基因检测技术领域。该致病基因位点数据库的建立方法包括以下步骤:获取经临床验证的致病基因位点数据信息,作为参考数据;获取所述参考数据中由于氨基酸改变致病的基因位点,并对此位点氨基酸的密码子进行扩展;获取所述参考数据中由于剪切位点改变致病的基因位点,并对此位点的其它突变形式进行扩展;对上述数据进行筛选,剔除人群突变发生频率高于预定阈值的位点,剩余高风险致病突变位点和高风险致病剪切位点,与所述参考数据组合,即组成所述致病基因位点数据库。该数据库收录了大量致病风险很高的位点记录,可以减少遗漏的可能性,大大提高了临床解读工作的准确性和效率。
- 一种用于临床病原诊断的高质量细菌基因组数据库构建方法及系统-202211486885.1
- 张佩佩;邓望龙;张全全;任用;李诗濛 - 江苏先声医疗器械有限公司;江苏先声医学诊断有限公司;南京先声医学检验实验室有限公司
- 2022-11-24 - 2023-09-29 - G16B50/00
- 本申请属于生信技术领域,具体涉及一种用于临床病原诊断的高质量细菌基因组数据库构建方法及系统,在保证基因组质量、分类信息准确以及物种多样性前提下,本申请能够极大程度精简数据库并提高物种注释效率和准确性。
- 一种基于调制编码的DNA存储方法-202110557918.6
- 刘文斌;昝乡镇;姚祥宇;李树栋;许鹏;方刚;陈智华;石晓龙;鲍振申 - 广州大学
- 2021-05-21 - 2023-09-26 - G16B50/00
- 本发明提供的一种基于调制编码的DNA存储方法,方法包括以下步骤:获取调制码,将计算机文件转换为二进制字符串,根据调制码将二进制字符串进行调制编码,得到DNA存储序列;将DNA存储序列合成得到DNA分子序列,将DNA分子序列进行存储;将存储的DNA分子序列进行测序,得到DNA分子序列的读长,根据调制码对读长进行纠错,将纠错后的DNA分子序列恢复得到计算机文件;方法在不同错误率下,增大测序深度,数据恢复率仍然呈上升趋势,方法还能够有效地减少数据存储过程中的信息冗余,鲁棒性高,可广泛应用于系统生物学研究技术领域。
- 牦牛酸乳样品采集的菌株资源库信息统计方法-202310278499.1
- 谢剑;曲崧;税晓燕 - 红原牦牛乳业有限责任公司
- 2023-03-21 - 2023-09-22 - G16B50/00
- 本发明提供牦牛酸乳样品采集的菌株资源库信息统计方法,包括:获取牦牛酸乳样品采集的菌株数据,基于预设的归类标准,对菌株数据进行分类,获得若干类第一标签标注数据;基于空白资源库,建立若干个第二标签标注空白数据集,根据预设的第一标签和第二标签的映射规则,将第一标签标注数据加入到第二标签标注空白数据集,获得第二标签标注数据集;基于第一标签,根据菌株数据的变动频率,建立若干个信息统计类目;分析第二标签标注数据集的重要程度,设置统计顺序,根据信息统计类目和统计顺序进行信息统计。本发明通过对菌株资源库信息统计,可以快速、全面、直观和科学地获得信息统计结果,为菌株的研究使用提供丰富的数据参考。
- 一种用于基因比对的加速方法、装置、存储介质与服务器-202010442856.X
- 谭光明;王元戎;张中海 - 北京哲源科技有限责任公司
- 2020-05-22 - 2023-09-15 - G16B50/00
- 本发明提出一种用于基因比对的加速方法,其特征在于,包括:步骤1,获取待比对的基因序列,并将该基因序列中的各碱基存储于一压缩式BWT数据结构,得到一BWT序列,于该BWT序列中插入一计数点,得到一压缩序列;步骤2,获取一目标碱基,将该压缩序列中的该计数点以表项的形式存储于一查找表中,通过访存该查找表中的该计数点,对该压缩序列中的每一个碱基与所述目标碱基进行比对,得到比对结果;其中,所述压缩式BWT数据结构采用二进制位存储所述基因序列中的各碱基。
- 一种微生物宏基因组数据库构建方法及系统-202310813478.5
- 张勇 - 广州源古纪科技有限公司
- 2023-07-05 - 2023-09-15 - G16B50/00
- 本申请提供一种微生物宏基因组数据库构建方法及系统,通过结合短片段序列AI识别算法以及共有特异AI判别算法的协同解析思路,可以实现对微生物基因组资源的双重存储目录分析,从而提高微生物基因组资源的存储目录确定准确性和可靠性。通过短片段序列AI识别算法确定第一微生物物种宏基因组信息对应的第一微生物基因组资源的短片段序列识别结果,可以实现粗略的解析操作,利用短片段序列识别结果进行进一步的共有/特异分析处理能够准确得到共有特异判别变量,可以利用短片段序列识别结果和共有特异判别变量进行协同解析操作,得到结构化数据库存储目录,以便通过该结构化数据库存储目录进行高质量且有序的数据库构建。
- 一种基于AL-WGAN-GP的太赫兹光谱数据扩充方法-202310644334.1
- 吴文刚;熊仕松;陈天福;陈雨萨;孙宏顺;曹云昊 - 北京大学
- 2023-06-01 - 2023-09-12 - G16B50/00
- 本发明公开了一种基于AL‑WGAN‑GP的太赫兹光谱数据扩充方法,属于计算机应用技术领域。本发明将不同水蒸气湿度以及模拟硬件设备干扰下的高斯噪声添加到真实的太赫兹光谱数据中,并且使用数学方法进行数据平滑,插值,归一化等处理,在AL_WGAN‑GP网络结构中增加了注意力机制的特征通道,用于提升整个网络模型的性能,最终达到纳什均衡,可以生成近乎真实的模拟数据,从而构建手性THz数据库。
- 核醣体RNA数据库的建构方法-202210808183.4
- 詹韵玄;吴逸文;林介华;许银雄;叶集孝;廖玉洁;蔡宗宪 - 宏碁股份有限公司;宏碁智医股份有限公司;长庚医疗财团法人基隆长庚纪念医院;台湾卫生研究院
- 2022-05-25 - 2023-09-12 - G16B50/00
- 本发明提供一种核醣体RNA数据库的建构方法,包括以下步骤:选择核酸序列数据库来源;进行物种分类法则正规化与均一化;利用AI技术进行正规化分类校正;挑选序列物种所属的界;筛减冗余序列及长度不符的序列;针对非A、T、C或G的未知碱基设定临界值,排除超过临界值的未知碱基;以及排除分类信息不足的序列。
- 一种人体肠道菌群检测方法、装置及存储介质-202010120418.1
- 罗文;韩丽娟;邓煜盛 - 康美华大基因技术有限公司
- 2020-02-26 - 2023-09-12 - G16B50/00
- 本发明公开了一种人体肠道菌群检测方法,首先收集大量的人体粪便样本,并对每个粪便样本进行处理得出肠道菌群信息,然后根据每个样本的肠道菌群信息构造肠型以及菌群多样性分布趋势图;将待检测样本的肠道菌群信息和系统中构造的肠型确定待检测样本的肠型,以及根据待检测样本的肠道菌群信息和系统中的菌群多样性分布趋势图进行对比,进而得出待检测样本的检测结果,实现对肠道菌群的检测。通过本发明可实现人体肠道菌群的检测,为进一步将人体肠道菌群的检测应用于肥胖检测以及研究提供帮助及参考。本发明还提供了一种人体肠道菌群检测装置及存储介质。
- 一种基于NLP构建孟德尔遗传疾病分子诊断数据库的方法、设备、系统及可存储介质-202310508403.6
- 吴南;陈泽夫;范燃;杨永鑫;蔡继昊 - 中国医学科学院北京协和医院
- 2023-05-08 - 2023-09-08 - G16B50/00
- 本发明涉及一种基于NLP构建孟德尔遗传疾病分子诊断数据库的方法、设备、系统及可存储介质。所述数据库构建的方法包括:获取与孟德尔遗传疾病相关的文献;基于NLP提取所述文献中的信息,所述文献中的信息包括孟德尔遗传疾病信息和孟德尔遗传疾病基因信息;将所述文献中的信息进行向量化表示,得到向量化表示的孟德尔遗传疾病信息和基因信息;基于所述向量化表示的孟德尔遗传疾病信息和基因信息,构建孟德尔遗传疾病分子诊断数据库。本发明构建的数据库基于研究前沿、数据全面可靠、可快速更新,为孟德尔遗传疾病分子诊断和治疗领域的研究人员、临床医生提供了宝贵资源,有重要的科研和临床价值。
- 一种批量生物数据处理方法、装置及介质-202310588835.2
- 刘睿;吴刚;郭松涛 - 西北大学
- 2023-05-24 - 2023-09-05 - G16B50/00
- 本发明涉及批量生物数据处理方法,包括:获取用户输入的初始命令行命令;获取所述用户针对所述初始命令行命令输入的标记信息,所述标记信息包括所述初始命令行命令中携带的生物信息文件的输入信息和/或输出信息;根据所述标记信息,向所述用户响应对应的关联控制界面,以供用户通过所述关联控制界面输入所述输入信息对应的待输入的生物信息文件的匹配策略,和/或待输出的生物信息文件的输出规则,以及批量命令转换规则;根据所述待输入的生物信息文件的匹配策略,和/或待输出的生物信息文件的输出规则,并结合所述批量命令转换规则,生成针对若干生物信息文件进行处理的批量命令行命令;执行所述批量命令行命令,并向所述用户反馈执行结果。
- DOE实验软件实施方法、系统及设备-202310739474.7
- 王逢;张越;孙兰超;程亚飞;李朝东 - 上海乐纯信息技术有限公司;上海乐纯生物技术股份有限公司
- 2023-06-20 - 2023-09-05 - G16B50/00
- 本发明提供了一种DOE实验软件实施方法、系统及设备,所述方法包括步骤:获取用户输入的实验设计参数;自预设参考实验方法列表中,获取与实验设计参数匹配的至少一参考实验方法,并将参考实验方法展示给用户,以供用户选择;获取用户选中的参考实验方法,作为备选实验方法;基于实验设计参数和备选实验方法,生成训练样本集;基于训练样本集,对预设分析模型进行训练,获得目标分析模型;根据目标分析模型,自初始自变量因子中筛选得到目标自变量因子;以及依据目标自变量因子对备选实验方法进行校正,获得目标实验方法;本发明提高了基于DOE实验设计方法的生物实验流程的标准化和自动化程度,利于提高DOE实验实施效率。
- 一种基于环境微生物组数据库的污染物溯源方法-202310634031.1
- 许玫英;林立洲;杨山;董美君;柳燕贞 - 广东省科学院微生物研究所(广东省微生物分析检测中心)
- 2023-05-31 - 2023-09-01 - G16B50/00
- 本发明公开了一种基于环境微生物组数据库的污染物溯源方法。构建不同污染源的微生物组数据库,收集采样点位微生物群落,将两者进行对比分析判断潜在污染源。本发明通过构建环境微生物组数据库,基于不同生境中微生物群落指纹特征,通过建立微生物群落溯源模型,无须依赖区域内潜在污染源微生物组信息,即能对目标区域的微生物群落进行溯源,据此判别目标区域的污染特征及潜在污染源,且能同时鉴别多种污染类型。本发明方法易操作,效率高,准确性好,对生态健康评价及环境治理和保护具有十分重要的参考价值。
- 一种病原微生物基因组数据库及其构建方法和应用-202310221252.6
- 叶生鑫;周桂兰 - 武汉艾迪康医学检验所有限公司
- 2023-03-09 - 2023-09-01 - G16B50/00
- 本发明公开一了种病原微生物基因组数据库及其构建方法和应用,属于病原宏基因组检测领域。构建方法包括以下步骤:基因组及相关说明性文件获取;物种筛选:细菌去除种属名称不明确、暂定种,病毒去除噬菌体;按照预定规则筛选参考基因组;基因组筛选:保留参考基因组、代表性基因组,去除异常基因组,细菌和病毒去除完整度低和污染率高基因组;去除分类错误基因组、去除质粒序列、去除污染序列、去除宿主同源序列、去除参考物种基因组同源序列、去除低质量序列、去除冗余序列,基因组拼接。本发明构建的病原检测微生物高质量基因组数据库数据全面、质量高,用于宏基因组测序分析检测病毒时,分析时间短,分析结果准确度高。
- 搜库软件在非靶代谢的靶向验证代谢物分析中的应用及分析方法-202310450098.X
- 雷焕娜;赵晓雯;余文祥;赵亚丽 - 北京诺禾致源科技股份有限公司
- 2023-04-24 - 2023-08-29 - G16B50/00
- 本发明涉及代谢物分析技术领域,尤其是涉及搜库软件在非靶代谢的靶向验证代谢物分析中的应用及分析方法。本发明提出了一种基于搜库软件的非靶代谢物的靶向验证代谢物数据处理方法,通过使用搜库软件处理PRM的二级质谱图数据,实现了只需要导入PRM二级质谱图数据,设置搜库参数即可自动化运行,最后得到准确可靠的定性定量结果。该方法运行过程中无需人工干预,减少人为误差,弥补了freestyle处理非靶代谢物靶向验证数据中存在的问题。
- 面向基因比对的细粒度并行负载特征抽取分析方法及系统-202010278219.3
- 谭光明;刘万奇;臧大伟;陈灿;孙凝晖 - 中国科学院计算技术研究所
- 2020-04-10 - 2023-08-29 - G16B50/00
- 本发明提出一种面向基因比对的细粒度并行负载特征抽取分析方法及系统。本发明抽取的这些负载特征着眼于设计细节,以较细的粒度来分析基因比对的应用,从而使得加速器的结构更具有针对性、效率更高。很多加速器设计均着眼于应用的整体层面,着重刻画应用的“粗粒度”的特征,而定制结构的设计最终还是要落在细节上。此外,这些细粒度的负载特征常常出现在多个基准程序或者应用软件中,本文对这些“共性”部分进行归纳和抽象,对并行模式相同的特征给出统一的设计方案指导,提升了结构设计方法的通用性。
- 一种基于DNA存储介质的文本存储方法-202011508358.7
- 刘文斌;昝乡镇;姚祥宇;许鹏;方刚;陈智华;石晓龙 - 广州大学
- 2020-12-18 - 2023-08-15 - G16B50/00
- 本发明提供的一种基于DNA存储介质的文本存储方法,方法包括:获取原始文本,对原始文本进行编码得到DNA存储序列;将DNA存储序列进行合成,得到DNA分子序列,对DNA分子序列进行扩增,将扩增后的DNA分子序列进行存储;获取存储的DNA分子序列,进行转码得到原始文本;进行转码得到原始文本包括步骤:对存储的DNA分子序列进行测序,得到DNA分子序列的读长;预处理读长,去除读长中的噪音数据,将预处理后的读长进行转码得到原始文本。方法通过直接通过序列的读长将存储的DNA分子序列进行转换,去除了较多的冗余码,提高了存储效率,方法转码以及解码过程中,充分运用了原始文本中的语义信息,查询处理能力强,可广泛应用于系统生物学研究技术领域。
- 大数据质量控制方法、系统、超级计算机和存储介质-202310475370.X
- 杨帅;贾晓艺;苏亮;谭华;岳国峰;王卓亚;董振华;丁燕梅;王双;付艳;张楠 - 青岛国实科技集团有限公司
- 2023-04-27 - 2023-08-11 - G16B50/00
- 本申请涉及一种大数据质量控制方法、系统、超级计算机和计算机可读存储介质,其中,该方法包括:源数据获取步骤,从预设多个数据源获取源数据;知识图谱构建步骤,基于源数据经知识抽取、数据对齐构建知识图谱,知识图谱包括:实体数据、关系数据、三元组数据及子图数据;质量控制模型构建步骤,配置质量控制参数并基于质量控制参数及知识图谱构建质量评价数据集,构建多模态端到端大数据质量控制模型,利用质量评价数据集训练质量控制模型,训练后的质量控制模型用于基于输入的实体数据、子图数据和/或三元组数据计算并输出数据置信值。通过本申请,实现基于图数据的大数据质量控制,提高质量控制方法的领域扩展性。
- 用于生物信息分析的数据处理系统及外部资源管理方法-202310572932.2
- 卢欣;于鸿磊;刘继龙;李召义;李昭强;陈林;肖庆宇;孙博文;程瑾瑜;郎志坚;陈秭如;肖华源;周剑文;张鑫;李亦学;谭待 - 北京火山引擎科技有限公司;广州国家实验室
- 2023-05-19 - 2023-08-11 - G16B50/00
- 本申请公开了应用于数据处理技术领域的用于生物信息分析的数据处理系统及外部资源管理方法。该数据处理系统包括操作模块以及目标数量的控制模块。操作模块分别与目标数量的所述控制模块连接,每个控制模块与一个外部资源系统通过API应用程序接口代理连接。API代理用于实现与所述外部资源系统匹配的API转换。操作模块,用于获取任务指令,向目标控制模块发送所述任务指令。目标控制模块,用于调用与目标控制模块连接的目标外部资源系统执行任务指令。如此能够解除接口类型与资源结构之间的耦合,实现对不同结构的资源的外部资源系统进行管理,实现对异构资源的利用。
- 基因组序列和注释信息的评估方法、装置、设备及介质-202310612044.9
- 赵学彤;陈梅丽;鲍一明 - 中国科学院北京基因组研究所(国家生物信息中心)
- 2023-05-26 - 2023-08-08 - G16B50/00
- 本申请提供了一种基因组序列和注释信息的评估方法、装置、设备及介质,该方法包括:获取待评估基因组序列及待评估注释信息的输入文件;响应信息提取命令执行操作,对输入文件进行信息提取,从输入文件中获取不同类型的待评估文件,并将待评估文件和预设的测试文件分别输入到评估工具中,得到评估工具输出的第一评估结果和测试结果;使追加评估标准对待评估文件进行再次评估,得到第二评估结果;根据第一评估结果和第二评估结果生成待评估基因组序列及待评估注释信息质量的目标评估结果。本申请使用现有的评估工具对待评估基因组序列及待评估注释信息进行评估的同时,还对评估工具的不足地方进行了弥补,能够得到更加准确、完善的结果。
- 一种面向基因调控网络的可达概率查询方法-202010500098.2
- 王之琼;丁子恒;张钊源;刘可伊;汪翰文;王炜祎祺 - 东北大学
- 2020-06-04 - 2023-08-08 - G16B50/00
- 本发明提供一种面向基因调控网络的可达概率查询方法,属于医学信息学技术领域,该方法针对基因调控网络复杂特性而设计了具有新意的图缩减算法,针对不确定图上点与边不同的特征所设计的不同的缩减方式,提高了图缩减的效率和适用范围;此外相较于传统的可能世界与可达概率计算分离的算法,本申请提供的可达概率查询算法将二者合二为一,大大降低了时间复杂度和空间复杂度。本申请针对基因调控网络所设计的高效、快速且精准的查询方法,为明确致病基因与致病基因、致病基因与靶向药物之间的关系提供了一种有效可行的办法。
- 具有标注活性功能的胶原寡肽数据库的建立方法-202310458673.0
- 曹如茵;崔俊锋 - 深圳柏垠生物科技有限公司
- 2023-04-26 - 2023-08-04 - G16B50/00
- 本发明属于数据库技术领域,具体涉及一种具有标注活性功能的胶原寡肽数据库的建立方法。本专利通过检索,调研相关文献,从文献中收集自动物胶原胶原的功能寡肽序列,构建了一个胶原寡肽数据库,该包含了胶原寡肽的氨基酸序列、结构和功能,及寡肽与人和动物胶原蛋白匹配图谱等综合性信息。该数据库可以为相关领域的研究人员提供有价值的研究资源,有助于深入了解胶原寡肽的结构和生物学功能,未来有望为该胶原蛋白领域的研究提供更加全面和精准的数据支持。
- 专利分类