[发明专利]一种判断叠鞘石斛纯种相近度的方法的建立、判断标准以及判断方法在审
申请号: | 201710332024.0 | 申请日: | 2017-05-11 |
公开(公告)号: | CN108875304A | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | 赵田;张国强 | 申请(专利权)人: | 北京蓝标一成科技有限公司 |
主分类号: | G06F19/20 | 分类号: | G06F19/20;G06K9/62 |
代理公司: | 北京易正达专利代理有限公司 11518 | 代理人: | 路远 |
地址: | 100176 北京市北京经济技术开*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 叠鞘石斛 置信区间 样本 判断标准 正态分布 纯净度 标准差 节间茎 相近度 鉴别 形态学 采集 正态性检验 标准区间 基因测序 计算公式 人工种植 数据建立 现实意义 直径变量 准确率 | ||
1.一种判断叠鞘石斛纯种相近度的方法的建立,其特征在于:所述建立过程包括以下步骤:
S1:标准数据采集:采集与基因测序结论一致的叠鞘石斛样本,样本容量为n,测定每个样本的第二个节间茎直径,得到第二个节间茎直径变量的测量数值;
S2:正态性检验:对样本第二个节间茎直径变量进行正态性检验;
S3:标准区间:若步骤S2中所得到的结果为服从正态分布,则按照正态分布总体计算公式得出均值的95%置信区间和标准差的95%置信区间;
若步骤S2中叠鞘石斛的第二个节间茎直径变量正态性检验结果为不服从正态分布,则如果样本容量超出30,则根据中心极限定理可知,该样本仍然能够按照正态总体的公式计算其均值的95%置信区间和标准差的95%置信区间;
上述得到的均值的95%置信区间和标准差的95%置信区间便能够作为鉴别未知样本纯净度的标准范围。
2.根据权利要求1所述的判断叠鞘石斛纯种相近度的方法的建立,其特征在于:步骤S1得到第二个节间茎直径变量的测量数值后,根据该第二个节间茎直径变量的测量数值计算第二个节间茎直径变量的基本统计量,所述基本统计量包括平均水平和离散程度,然后根据基本统计量确定数据有无异常值,若有异常值则进行排查,如果属于测量误差或记录失误则删除异常点,如果不是因为误差,那么应该保留此数据。
3.根据权利要求2所述的判断叠鞘石斛纯种相近度的方法的建立,其特征在于:所述平均水平包括均值、中位数和众数中的至少一种,所述离散程度包括标准差、平均绝对离差和变异系数;
所述基本统计量还包括根据第二个节间茎直径变量的测量数值制作直方图和/或盒形图将数据可视化,使其更方便确定有误异常值。
4.根据权利要求1所述的判断叠鞘石斛纯种相近度的方法的建立,其特征在于:所述正态性检验包括直观图像分析和假设检验中的至少一种。
5.根据权利要求4所述的判断叠鞘石斛纯种相近度的方法的建立,其特征在于:所述正态性检验包括直观图像分析和假设检验。
6.根据权利要求5所述的判断叠鞘石斛纯种相近度的方法的建立,其特征在于:所述直观图像分析的方法为:
①根据正态经验分布函数绘制叠鞘石斛的正态经验分布函数曲线;
根据正态概率密度函数绘制叠鞘石斛的正态概率密度曲线;当μ=0,σ=1时,正态分布就成为标准正态分布:
②根据步骤S1中得到的第二个节间茎直径变量的测量数值,并根据公式为的经验分布函数绘制真实经验分布函数;
根据步骤S1中得到的第二个节间茎直径变量的测量数值,并根据公式为的概率密度函数绘制真实概率密度函数图;
③将真实经验分布函数图与正态分布的分布函数曲线对比,通过判断曲线偏差程度的大小来初步判定样本数据是否符合正态分布;将真实概率密度函数图与正态分布的概率密度曲线对比,同样根据偏差程度大小及曲线形状一致性程度,来判定样本数据是否是服从正态分布的;
若真实经验分布函数图和正态分布的分布函数图或者真实经验概率密度函数图和正态分布的概率密度函数图的偏差小且形状一致,则待检测叠鞘石斛样本第二个节间茎直径符合正态分布,若偏差明显很大且形状明显不一致,则待检测叠鞘石斛样本第二个节间茎直径不符合正态分布。
7.根据权利要求5所述的判断叠鞘石斛纯种相近度的方法的建立法,其特征在于:所述假设检验包括JB检验、KS检验和Lilliefors检验中的任意一种。
8.根据权利要求7所述的判断叠鞘石斛纯种相近度的方法的建立法,其特征在于:所述假设检验为Lilliefors检验,所述Lilliefors检验统计量T=sup|F*(x)-S(x)|,式中,T为Liffiefors检验统计量,F*(x)是均值为0,标准差为1的正态分布累积分布函数,S(x)是的经验分布函数值,在α的显著性水平下,当检验统计量T超过检验临界值时,拒绝原假设H0;否则,不能拒绝原假设。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京蓝标一成科技有限公司,未经北京蓝标一成科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710332024.0/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用