[发明专利]一种病原微生物参考知识库的最大多样性聚类构建方法在审
申请号: | 202110995722.5 | 申请日: | 2021-08-27 |
公开(公告)号: | CN113723501A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 吴俊阳 | 申请(专利权)人: | 吴俊阳 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G16B20/00 |
代理公司: | 安徽思沃达知识产权代理有限公司 34220 | 代理人: | 李彦程 |
地址: | 362342 福建省泉*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 病原微生物 参考 知识库 最大 多样性 构建 方法 | ||
本发明公开了一种病原微生物参考知识库的最大多样性聚类构建方法,属于生物技术领域,该构建方法具体步骤如下:(1)收集病原微生物全基因组序列;(2)将序列进行OTU聚类,并进行统计;(3)对错误序列进行检测删除并进行记录;(4)对各病原微生物进行注释匹配;(5)构建微生物知识库,同时将数据表反馈给工作人员;本发明能够扩大知识库适用人群,方便人们了解各类病原微生物,提高了科技资源共享服务质量,能够保证知识库的完整性,提高知识库的构建质量,节省工作人员排查时间。
技术领域
本发明涉及生物技术领域,尤其涉及一种病原微生物参考知识库的最大多样性聚类构建方法。
背景技术
随着科技的不断发展,专家发现的病原体的种类涵盖细菌、真菌、寄生虫、病毒、支原体或衣原体、分枝杆菌等,涵盖的种类超过2万种,病原微生物参考知识库建设时不仅需要包括染色体,还需要考虑线粒体、转录组序列及非编码序列等,当前病原微生物的知识库建立的方法是采用从国际公共数据库中通过获取、整合、筛选等一系列处理过程进行建立,通常知识库的建立方式有三种,分别是冗余方法、菌株代表序列法和打断重组法,病原微生物的知识库的出现推动新时代我国病原微生物资源保护和利用工作更好发展,为科学研究、技术进步和社会发展提供高质量的科技资源共享服务;因此,发明出一种病原微生物参考知识库的最大多样性聚类构建方法变得尤为重要;
经检索,中国专利号CN112800245A公开了一种病原微生物参考知识库的最大多样性聚类构建方法,该发明虽然准确性高、检测效率高且数据冗余率低,但是未对构建完成的知识库中的参考信息进行解释说明,知识库适用人群范围小,不方便人们了解各类病原微生物;此外。现有的病原微生物参考知识库的最大多样性聚类构建方法在聚类过程容易因判断失误导致部分病原微生物数据未进行聚类,无法保证知识库的完整性,降低知识库的构建质量,需要工作人员花费大量时间进行数据排查;为此,我们提出一种病原微生物参考知识库的最大多样性聚类构建方法。
发明内容
本发明的目的是为了解决现有技术中存在的缺陷,而提出的一种病原微生物参考知识库的最大多样性聚类构建方法。
为了实现上述目的,本发明采用了如下技术方案:
一种病原微生物参考知识库的最大多样性聚类构建方法,该构建方法具体步骤如下:
(1)收集病原微生物全基因组序列:对云端数据库中存储的病原微生物全基因组序列进行提取,并对提取出的基因组序列进行去重筛选;
(2)将序列进行OTU聚类,并进行统计:将筛选完成的基因组序列进行OTU聚类,同时将无法聚类的基因组序列处理生成错误序列,并将其录入OTU筛选表中;
(3)对错误序列进行检测删除并进行记录:对错误序列进行数据筛错,并将错误序列信息进行更新,同时对其重新进行OTU聚类处理;
(4)对各病原微生物进行注释匹配:依据OTU聚类表中分类完成的数据进行数据检索,并对各病原微生物全基因组序列的相关信息进行抓取,同时对其进行信息匹配;
(5)构建微生物知识库,将数据表反馈给工作人员:将信息匹配完成的病原微生物数据整合生成微生物知识库,并将未匹配成功的病原微生物全基因组序列反馈给工作人员,同时由工作人员对其进行信息补充,微生物知识库进行数据更新。
进一步地,步骤(1)中所述去重筛选具体步骤如下:
步骤一:服务器将病原微生物全基因组序列依据首字母A~Z进行有序排列,并将其分为26组数据,同时将未排序的病原微生物全基因组序列组成第27组数据;
步骤二:依次对各组数据中的病原微生物全基因组序列进行重复数据查询,并将其中重复的病原微生物全基因组序列删除。
进一步地,步骤(2)中所述OTU聚类具体步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吴俊阳,未经吴俊阳许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110995722.5/2.html,转载请声明来源钻瓜专利网。