[发明专利]一种最优结构方程模型自动生成方法在审
申请号: | 201710766280.0 | 申请日: | 2017-08-30 |
公开(公告)号: | CN107563135A | 公开(公告)日: | 2018-01-09 |
发明(设计)人: | 黄翰;胡友成;郝志峰 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 广州粤高专利商标代理有限公司44102 | 代理人: | 何淑珍 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 最优 结构 方程 模型 自动 生成 方法 | ||
技术领域
本发明一般涉及计算机分析处理结构方程模型的领域,具体涉及一种最优结构方程模型自动生成方法。
背景技术
结构方程模型是一种非常通用的、主要的线性统计建模技术,广泛应用于心理学、经济学、社会学、行为科学等领域的研究。这些等领域的研究中,研究人员经常会碰到研究中涉及的变量并不能准确、直接地测量。这种变量我们称之为潜变量,例如智力、学习动机、家庭社会经济地位、顾客满意度、顾客忠诚度等等。这些潜变量并不能直接准确测量,但可以通过某些间接的手段去估算它,即使用一些观测指标去测量那些潜变量。例如,在研究学生的学业成就方面的问题时,研究人员可以以学生的语文、数学、外语等科目的成绩去作为学生学业成就的指标。传统的统计分析方法并不能很好地处理这些潜变量,而结构方程模型就能同时很好地处理这些潜变量及其指标。相对来说,结构方程模型是一个包含面很广的数学模型,它可以分析一些涉及潜变量的非常复杂的关系。
现有的结构方程模型分析方法,从应用者的角度,都需要研究者根据应用领域的理论或者经验,提出一个基本的结构方程模型,继而利用统计分析软件,计算模型的拟合程度,分析模型的不足,再手动修正模型。在模型修正后模型仍然无法拟合,或者失去理论意义的情况下,甚至需要重新建立模型。这个过程需要研究者具有一定的专业基础,而且需要大量的反复验证实验,费时费力,让很多研究者望而却步。随着结构方程模型的应用范围的逐渐扩大,越来越多领域的研究者希望利用结构方程模型进行统计分析。最优结构方程模型自动生成方法将有助于解决用户使用结构方程模型的问题。
发明内容
本发明针对当前结构方程模型建模技术的不足,提供了一种最优结构方程模型自动生成方法。本发明的目的在于在只确定结构方程模型的测量模型的情况下,迅速的生成所有结构模型,然后根据拟合指数的拟合情况来评判结构方程模型得分,并获取得分最高的N个模型,具体技术方案如下。
最优结构方程模型自动生成方法,包括以下步骤:
(a)存储预设的测量模型;
(b) 根据步骤(a)的测量模型规模,遍历全局空间中所有的结构模型,每次选取一种结构模型,并且结合步骤(a)的测量模型,构建对应的结构方程全模型;
(c)将步骤(b)中的结构方程全模型作为输入,使用极大似然估计法估计参数,并计算出该模型的拟合指数;
(d) 循环操作步骤(b)和(c),直至搜索完全局空间中的结构模型;在遍历过程中给每个结构模型评分;
(e)根据拟合指数接受范围,计算模型得分,并按照得分高低排序,保存得分最高的结构方程全模型。
上述最优结构方程模型自动生成方法,步骤(a)中,采用特定数据结构存储结构方程的全模型,包括模型中的所有观测变量、所有潜在变量、变量归属关系和每个归属关系上的因子载荷量。设计的数据结构包括三个属性:1个观测变量列表,1个潜在变量列表,和一个二维矩阵。其中二维矩阵的行数为潜在变量的数量,列数为观测变量和潜在变量的总个数。
上述最优结构方程模型自动生成方法,步骤(b)中,设计了特定的遍历方法。该方法首先根据待分析的结构方程模型的潜在变量的数量m,计算由所有结构关系构成的全局空间大小N,其中N=3m(m-1)/2。然后使用0~N-1的三进制表示方式来表示对应全局空间中的一种结构关系。例如假设潜在变量的个数为3,则全局空间的大小为N=33(3-1)/2=27。使用0~26的其中一个数字的三进制表述方式来表示全局变量的一种关系,即第1种结构关系为000(3),第2种结构关系为001(3),...第27种结构关系为222(3)。假设以上潜变量构成的有向图为G=<V,E>,V={v1,v2,v3},三进制数的数字‘0’表示不存在边,‘1’表示存在正向边,‘2’表示反向边,即‘011’表示v1v2间不存在关系,v1→v3,v2→v3。以此类推。确定了结构关系后,把关系按照有向图01邻接矩阵的形式存储在(a)设计的数据结构中。
上述最优结构方程模型自动生成方法,其特征在于(c)中设计了(a)中的数据结构转换为R语言中的结构方程模型模型构造语句的方法。待分析的结构方程模型,是使用R语言sem软件包中的结构方程模型定义语句定义的。把(a)中数据结构的数据转换成模型定义语言,传给R语言处理,并使用极大似然估计法得出估计参数和拟合指数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710766280.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用