[发明专利]一种病原微生物参考知识库的最大多样性聚类构建方法在审
申请号: | 202110995722.5 | 申请日: | 2021-08-27 |
公开(公告)号: | CN113723501A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 吴俊阳 | 申请(专利权)人: | 吴俊阳 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G16B20/00 |
代理公司: | 安徽思沃达知识产权代理有限公司 34220 | 代理人: | 李彦程 |
地址: | 362342 福建省泉*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 病原微生物 参考 知识库 最大 多样性 构建 方法 | ||
1.一种病原微生物参考知识库的最大多样性聚类构建方法,其特征在于,该构建方法具体步骤如下:
(1)收集病原微生物全基因组序列:对云端数据库中存储的病原微生物全基因组序列进行提取,并对提取出的基因组序列进行去重筛选;
(2)将序列进行OTU聚类,并进行统计:将筛选完成的基因组序列进行OTU聚类,同时将无法聚类的基因组序列处理生成错误序列,并将其录入OTU筛选表中;
(3)对错误序列进行检测删除并进行记录:对错误序列进行数据筛错,并将错误序列信息进行更新,同时对其重新进行OTU聚类处理;
(4)对各病原微生物进行注释匹配:依据OTU聚类表中分类完成的数据进行数据检索,并对各病原微生物全基因组序列的相关信息进行抓取,同时对其进行信息匹配;
(5)构建微生物知识库,将数据表反馈给工作人员:将信息匹配完成的病原微生物数据整合生成微生物知识库,并将未匹配成功的病原微生物全基因组序列反馈给工作人员,同时由工作人员对其进行信息补充,微生物知识库进行数据更新。
2.根据权利要求1所述的一种病原微生物参考知识库的最大多样性聚类构建方法,其特征在于,步骤(1)中所述去重筛选具体步骤如下:
步骤一:服务器将病原微生物全基因组序列依据首字母A~Z进行有序排列,并将其分为26组数据,同时将未排序的病原微生物全基因组序列组成第27组数据;
步骤二:依次对各组数据中的病原微生物全基因组序列进行重复数据查询,并将其中重复的病原微生物全基因组序列删除。
3.根据权利要求1所述的一种病原微生物参考知识库的最大多样性聚类构建方法,其特征在于,步骤(2)中所述OTU聚类具体步骤如下:
第一步:工作人员设置百分比标识阈值X,27组数据与参考数据库中预先定义的聚类中心对齐;
第二步:各组数据依次对参考数据库进行查询,如果读取匹配的参考序列相似度大于或等于X,则将其分配给该参考序列定义的OTU,并将其处理生成OTU1;
第三步:将无法匹配参考数据库的病原微生物全基因组序列进行de novo,并将匹配完成的序列处理生成OTU2;
第四步:将未成功匹配的病原微生物全基因组序列标记为错误序列,同时将OTU1以及OTU2中的所有序列录入OTU聚类表中,将错误序列录入OTU筛选表中。
4.根据权利要求3所述的一种病原微生物参考知识库的最大多样性聚类构建方法,其特征在于,步骤(3)中所述数据筛错具体步骤如下:
S1:对OTU筛选表中的错误序列依次进行序列检测,并判断其是否为嵌合体序列或测序错误序列;
S2:若为嵌合体序列或测序错误序列,则将该序列删除,并在OTU筛选表中更新其相关信息;
S3:若不为嵌合体序列或测序错误序列,则对该序列重新进行OUT聚类处理,若聚类处理成功,则将其移出OTU筛选表,并更新OTU聚类表,若OUT聚类失败,同时将其信息反馈给工作人员,并由工作人员对其进行手动操作,同时依据工作人员操作信息更新OTU筛选表以及OTU聚类表。
5.根据权利要求1所述的一种病原微生物参考知识库的最大多样性聚类构建方法,其特征在于,步骤(4)中所述信息匹配具体步骤如下:
SS1:将OTU聚类表中各病原微生物全基因组序列依次与注释数据库进行比对;
SS2:依据比对结果将各病原微生物全基因组序列依据域、界、门、纲、目、科、属以及种进行分类统计;
SS3:与互联网通信连接,并开始对各病原微生物全基因组序列进行信息检索抓取,同时将抓取到的信息与对应病原微生物全基因组序列进行数据匹配。
6.根据权利要求1所述的一种病原微生物参考知识库的最大多样性聚类构建方法,其特征在于,步骤(5)中所述数据更新具体步骤如下:
P1:接收用户补充的数据信息,并将其与对应病原微生物全基因组序列进行匹配;
P2:将微生物知识库中的专业名词进行数据提取,并对各专业名词进行解释说明,同时将其匹配至对应病原微生物;
P3:更新完成,将更新信息反馈至各工作人员以及用户的智能设备。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吴俊阳,未经吴俊阳许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110995722.5/1.html,转载请声明来源钻瓜专利网。