基础知识 · 2024年10月22日

什么是结构方程建模 (SEM) 分析?

Riya Jain & Abhinash Jena于2020年2月10日发布

结构方程建模 (SEM) 分析是社会科学研究中用于测试任何时间点多个变量之间的联系的统计方法。SEM 分析是简单线性模型的扩展。

例如,有许多因素会影响组织承诺和员工的工作满意度。如果需要确定组织承诺和工作满意度水平对感知绩效的影响,那么使用简单的线性模型将是复杂和困难的。因此,SEM 分析有助于轻松将因素联系起来并得出结果。为说明联动而制定的模型如下图所示。

Sample SEM Model
图 1:SEM 模型示例

为什么使用 SEM 分析?

更简单的统计测试方法(如回归和因子分析)将因变量和自变量联系起来。但是,当存在大量因果变量或存在影响自变量的因素时,它会变得复杂。SEM 分析有助于研究单个模型中因果变量之间的直接和间接复杂关系。

通过包括可测量和不可测量的变量,SEM 分析确定了变量之间的联系。例如,智力水平和消费者对品牌的态度等心理变量可以使用量表以数字形式进行测量。在这种情况下,SEM 分析提供了将定性变量与影响它们的因素联系起来的机会。

表示变量之间链接的不同结构并定义变量、关系、误差和模型的性质的术语是:

  • 不可测量的变量称为潜在变量,
  • 自变量称为外生变量,
  • 对因变量和自变量之间已知关系的验证被视为验证性因子分析
  • 根据可测量变量计算不可测量变量的值时的误差或要点称为测量误差,并且
  • 不可测量变量之间的联系被定义为结构模型。

下图解释了进行 SEM 分析时常用的这些术语中的每一个。

Main terminologies of SEM analysis

需要满足 SEM 模型的假设才能获得准确的结果

  • 获得可靠结果需要较大的样本量,即样本量应至少为 100。
  • 假设 SEM 程序中的变量是连续的且呈正态分布的。然而,在研究从李克特量表获得的数据时,就像在自尊的情况下一样,虽然数据不是连续的,但变量是连续的。
  • 变量之间的关系本质上应该是线性的。
  • 不应有异常值。
  • 多个观察变量,即至少应包含三个变量来测量每个潜在变量。
  • 模型中不应存在多重共线性。
  • 应避免缺失数据。如果缺失的数据少于总数据的 5%,则可以进行删除,但如果缺失的数据超过 5%,则应采用最大似然估计方法。

可视化呈现

在讨论了每个技术术语的含义之后,本节提供了对这些术语的直观解释。

Figure 3: Path Diagram (Malkanthie, 2015)

在上图中,ME1、ME2、ME3、ME4 和 ME5 表示测量误差;OV1、OV2、OV3、OV4 和 OV5 是观测变量;LV1 和 LV2 显示潜在变量,RE1 描述残差。

此外,在上图中,有两个测量模型和一个结构模型,即

Measurement model
Structural model

SEM 分析的优势

与回归分析和因子分析相比,使用 SEM 分析有一定的好处,即

  • 通过非实验数据库测试理论命题,即员工的工作满意度或消费者的态度等理论变量可以通过仅包括影响他们的因素来进行比较。不需要进行实验研究来专门推导不可测量变量的数值。
  • 包括用于分析的观察变量和潜在变量,即 SEM 分析有助于在模型中包含可测量和不可测量的变量。例如,价格、销售额或折扣等可衡量因素的影响可以确定对不可衡量因素的影响,即使用 SEM 分析确定客户态度。
  • 模型的假设是灵活的,即非正态分布、数据库不连续和数据集不完整等问题可以通过修改来处理。
  • 验证性因子分析是通过 SEM 分析在探索性因子分析上完成的。即分析方法的重点是验证变量之间的联系,而不是探索哪个模型更合适。不过,SEM 分析也有助于比较模型并得出有关拟合更好的模型的信息,但侧重于测试模型的可靠性和有效性。
  • 由于包含测量误差,从分析中得出的结果更加可靠。由于在社会科学中计算因素的值时出错的可能性很大,因此在 SEM 分析中使用验证性因素分析方法有助于包括每个计算变量的测量误差以减少偏差。
  • 即使在存在多个因变量的情况下,也可以同时研究模型。作为单个线性或多元回归分析方程,它仅提供用于测试自变量与一个因变量的关系的工具。如果存在多个因变量,则需要多次重复该过程,即使存在大量自变量,分析也会变得复杂。SEM 分析克服了回归分析的这些复杂性,并有助于同时运行具有大量因变量和自变量的模型。
  • SEM 有助于测试模型的整体适用性,即使在存在多个关系的情况下也是如此。通常,在多重联系的情况下,即在存在各种因素或中介变量的情况下,很难得出有关模型准确性和有效性的信息。因此,通过提供绝对适应度、增量适应度和简约适应度指数的值进行 SEM 分析有助于验证模型的准确性。
  • 可以根据均值、方差或回归系数进行同时比较,即由于 SEM 模型可以同时分析不同的模型,因此可以很容易地完成不同模型结果之间的比较。

SEM 分析的局限性

尽管 SEM 分析是一种强大的统计分析技术,但使用 SEM 分析也存在一定的缺点。下面列出了进行 SEM 分析时提出的问题:

  • 该模型的重点是预测变量之间的因果关系,即假设检验结果的推导。说明变量之间相关性的非实验数据被转换为表示因果联系的模型。
  • 为了获得适当的指数值,即 NNFI 或卡方,可以进行大量修改。
  • 尽管这些假设很灵活,但假设的技术性和复杂性仍然禁止第一代使用 SEM 分析。

支持 SEM 分析的软件包

可以执行 SEM 分析的软件包包括:

  • AMOS(常用)
  • LISREL (传统方法)
  • EQS(与小样本一起使用)
  • Mplus(在样本不足时使用)
  • R
  • Mx
  • SEPATH 系列
  • CALIS

引用

  • Malkanthie, A. (2015) “结构方程建模的基本概念”,Lap Lambert 学术出版社,1(1 月),第 55 页。doi:10.13140/RG.2.1.1960.4647。