[发明专利]基于灰自助和未确知有理数的小样本试验数据估计方法有效
| 申请号: | 201810343037.2 | 申请日: | 2018-04-17 |
| 公开(公告)号: | CN108647186B | 公开(公告)日: | 2021-05-28 |
| 发明(设计)人: | 柯肇捷;周文雅;祝冀鲁;侯兴明;吴红朴;廖兴禾;李巧丽;孟礼 | 申请(专利权)人: | 大连理工大学 |
| 主分类号: | G06F17/18 | 分类号: | G06F17/18 |
| 代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 赵淑梅;李洪福 |
| 地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 自助 确知 有理数 样本 试验 数据 估计 方法 | ||
1.一种基于灰自助和未确知有理数的小样本试验数据估计方法,其特征在于包括以下步骤:
S1、小样本试验数据的灰自助生成;
通过N个小样本试验数据的设定,进行自助再抽样,并建立GM(1,1)模型,得到新的测试指标测量数据集合;
步骤S1中的小样本试验数据的灰自助生成,具体包括以下步骤:
S11、N个小样本试验数据的设定;
在武器装备试验中,假设针对某一测试指标得到的测量数据集合为:
X={x(t);t=1,2,…,N} (1)
式中x(t)为第t个测量数据,N为测量数据总数;
S12、自助再抽样;
从X中等概率可放回地随机抽取1个数据,记为x1(1),此抽取过程重复m次即可得到第1个自助样本,记为
X1={x1(1),x1(2),…,x1(m)} (2)
获得自助样本的整体抽取过程连续重复A次,则会得到A个自助再抽样样本,再抽样样本集合可记为
Y={X1,X2,…,Xi,…XA} (3)
式中Xi={xi(1),xi(2),…,xi(m)};
S13、GM(1,1)模型的建立;
针对自助样本Xi建立灰色模型GM(1,1),假设其一次累加生成序列为
式中h=1,2,…,m,则有的紧邻均值生成序列为
式中k=2,3,…,m,则有GM(1,1)模型xi(k)+azi(k)=b针对初始条件的时间响应序列为
式中k=1,2,…,m,为最小二乘估计参数列,其中
在式(6)中令k=m-1,m,通过一次累减生成算法即可得到自助样本Xi中第m+1个预测值,记为
于是得到新的测试指标测量数据集合为
X={x(1),…,x(N),x(N+1),…,x(N+A)} (9);
S2、未确知有理数的构造与优化;
建立未确知有理数,所建立的未确知有理数的可信度熵越大就越能刻画测试指标,当可信度熵取最大值时,估计未确知有理数的最佳阶数,实现优化;
步骤S2中的未确知有理数的构造与优化,具体包括以下步骤:
S21、未确知有理数的建立;
针对步骤S13挖掘生成的测量数据集合X,利用这N+A个数据来构造一个k(k<N+A)阶未确知有理数,记为[[c,d],φ(x)],其中
c=min{x(1),…,x(N),x(N+1),…,x(N+A)} (10)
d=max{x(1),…,x(N),x(N+1),…,x(N+A)} (11)
其中φ(x)为可信度分布密度函数,αi为试验数据取值xi时的可信度,且有0<αi<1;表示总可信度,且有0<α≤1;则,式中c≤xi≤d;
通常对区间[c,d]进行2k个等值划分,使得该区间数据值xi的领域控制半径均相等,则可得到试验数据取值xi(i=1,2,…,k)的表达式为
可信度αi则用试验数据值xi控制半径内数据出现的频率进行表示,即有
式中βi表示以值xi为中心、为控制半径的数据领域中的试验数据个数;
S22、未确知有理数阶数的优化;
利用未确知有理数对挖掘生成后的测量数据集合进行表达,反映了测试指标的数据值分布情况,可信度αi只是表明了取值xi的不确定性程度;
信息论中熵被定义为信息的均值,不确定性越大,熵也越大;
对测量数据集合,将未确知有理数中k个取值所提供的平均信息量定义为可信度熵,则可信度熵反映了对该测试指标认识的不确定性程度;
区间[c,d]上取值xi的频率越均匀,对测试指标的刻画越复杂,不确定性程度也就越大,未确知有理数的可信度熵也就越大;
为了从不确定的事情中获取最大的信息量,所构造未确知有理数的可信度熵越大就越能刻画测试指标;
因此,当可信度熵取最大值时,估计未确知有理数的最佳阶数;
步骤S22中,对于步骤S21中构造的k阶未确知有理数,其可信度熵定义为
令则k*即为所求的未确知有理数最佳阶数;
S3、基于未确知有理数的参数估计;
步骤S3中基于未确知有理数的参数估计,具体包括基于未确知有理数的点估计和/或区间估计;
步骤S3中,基于未确知有理数的点估计,具体包括以下步骤:
基于步骤S2的构造与优化过程,将描述测量数据集合X的k*阶未确知有理数A记为[[c,d],φ(x)],其中
通过k*阶未确知有理数A的构造,测试指标样本总体的离散化值通过小样本的灰自助生成已求得其中每一个xi的出现频率,但是不能确定样本总体的分布类型;
基于矩估计法,称下列一阶未确知有理数
为未确知有理数A的数学期望,也称E(A)为未确知期望或均值;
上述未确知期望的内涵是值实数作为未确知有理数A的真值估计有α的可信度;
则,当α=1时,E(A)为实数这时未确知有理数A就是随机变量,所以E(A)为随机变量的数学期望;当α<1时,E(A)为一阶未确知有理数,而非实数;
用方差D(A)来描述未确知有理数A到E(A)的离散程度,即
D(A)=E(A-E(A))2 (18)
不考虑作为A的均值的可信度,则认为E(A)为实数该式求解方差的实质是计算A到值实数的离散程度,从而有计算式
于是,有k*阶未确知有理数A的点估计值为其估计精度为
则定义上述点估计的可靠度为
步骤S3中,基于未确知有理数的区间估计,具体包括以下步骤:
给定置信水平1-β,根据指定的标准正态分布上侧β分位点表中查询u(β/2),基于下式计算给定置信水平下的置信区间半长度ε;
于是计算未确知有理数A的均值在置信水平1-β下的置信区间
针对挖掘生成的N+A个数据,假设有t个数据位于上述置信区间之外,则定义置信水平1-β下区间估计的可靠度为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810343037.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:快速计算统计中值的方法及装置
- 下一篇:一种城市环境效率的测量方法及测量系统





