[发明专利]一种病原微生物参考知识库的最大多样性聚类构建方法在审

专利信息
申请号: 202110995722.5 申请日: 2021-08-27
公开(公告)号: CN113723501A 公开(公告)日: 2021-11-30
发明(设计)人: 吴俊阳 申请(专利权)人: 吴俊阳
主分类号: G06K9/62 分类号: G06K9/62;G16B20/00
代理公司: 安徽思沃达知识产权代理有限公司 34220 代理人: 李彦程
地址: 362342 福建省泉*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 病原微生物 参考 知识库 最大 多样性 构建 方法
【权利要求书】:

1.一种病原微生物参考知识库的最大多样性聚类构建方法,其特征在于,该构建方法具体步骤如下:

(1)收集病原微生物全基因组序列:对云端数据库中存储的病原微生物全基因组序列进行提取,并对提取出的基因组序列进行去重筛选;

(2)将序列进行OTU聚类,并进行统计:将筛选完成的基因组序列进行OTU聚类,同时将无法聚类的基因组序列处理生成错误序列,并将其录入OTU筛选表中;

(3)对错误序列进行检测删除并进行记录:对错误序列进行数据筛错,并将错误序列信息进行更新,同时对其重新进行OTU聚类处理;

(4)对各病原微生物进行注释匹配:依据OTU聚类表中分类完成的数据进行数据检索,并对各病原微生物全基因组序列的相关信息进行抓取,同时对其进行信息匹配;

(5)构建微生物知识库,将数据表反馈给工作人员:将信息匹配完成的病原微生物数据整合生成微生物知识库,并将未匹配成功的病原微生物全基因组序列反馈给工作人员,同时由工作人员对其进行信息补充,微生物知识库进行数据更新。

2.根据权利要求1所述的一种病原微生物参考知识库的最大多样性聚类构建方法,其特征在于,步骤(1)中所述去重筛选具体步骤如下:

步骤一:服务器将病原微生物全基因组序列依据首字母A~Z进行有序排列,并将其分为26组数据,同时将未排序的病原微生物全基因组序列组成第27组数据;

步骤二:依次对各组数据中的病原微生物全基因组序列进行重复数据查询,并将其中重复的病原微生物全基因组序列删除。

3.根据权利要求1所述的一种病原微生物参考知识库的最大多样性聚类构建方法,其特征在于,步骤(2)中所述OTU聚类具体步骤如下:

第一步:工作人员设置百分比标识阈值X,27组数据与参考数据库中预先定义的聚类中心对齐;

第二步:各组数据依次对参考数据库进行查询,如果读取匹配的参考序列相似度大于或等于X,则将其分配给该参考序列定义的OTU,并将其处理生成OTU1;

第三步:将无法匹配参考数据库的病原微生物全基因组序列进行de novo,并将匹配完成的序列处理生成OTU2;

第四步:将未成功匹配的病原微生物全基因组序列标记为错误序列,同时将OTU1以及OTU2中的所有序列录入OTU聚类表中,将错误序列录入OTU筛选表中。

4.根据权利要求3所述的一种病原微生物参考知识库的最大多样性聚类构建方法,其特征在于,步骤(3)中所述数据筛错具体步骤如下:

S1:对OTU筛选表中的错误序列依次进行序列检测,并判断其是否为嵌合体序列或测序错误序列;

S2:若为嵌合体序列或测序错误序列,则将该序列删除,并在OTU筛选表中更新其相关信息;

S3:若不为嵌合体序列或测序错误序列,则对该序列重新进行OUT聚类处理,若聚类处理成功,则将其移出OTU筛选表,并更新OTU聚类表,若OUT聚类失败,同时将其信息反馈给工作人员,并由工作人员对其进行手动操作,同时依据工作人员操作信息更新OTU筛选表以及OTU聚类表。

5.根据权利要求1所述的一种病原微生物参考知识库的最大多样性聚类构建方法,其特征在于,步骤(4)中所述信息匹配具体步骤如下:

SS1:将OTU聚类表中各病原微生物全基因组序列依次与注释数据库进行比对;

SS2:依据比对结果将各病原微生物全基因组序列依据域、界、门、纲、目、科、属以及种进行分类统计;

SS3:与互联网通信连接,并开始对各病原微生物全基因组序列进行信息检索抓取,同时将抓取到的信息与对应病原微生物全基因组序列进行数据匹配。

6.根据权利要求1所述的一种病原微生物参考知识库的最大多样性聚类构建方法,其特征在于,步骤(5)中所述数据更新具体步骤如下:

P1:接收用户补充的数据信息,并将其与对应病原微生物全基因组序列进行匹配;

P2:将微生物知识库中的专业名词进行数据提取,并对各专业名词进行解释说明,同时将其匹配至对应病原微生物;

P3:更新完成,将更新信息反馈至各工作人员以及用户的智能设备。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吴俊阳,未经吴俊阳许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110995722.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top