R包lavaan的結構方程建模——潛變數結構模型

R包lavaan的潛變數結構模型

前文已經分別簡介了使用lavaan包執行驗證性因子分析（CFA）、路徑分析的過程，它們均為結構方程模型（SEM）的不同建模方法。本篇繼續展示潛變數結構模型（Latent Variable Structural Mode）。

潛變數結構模型可視為路徑分析的擴充套件，在路徑分析中，所考慮的變數都是已知的觀測變數，與此相比，潛變數結構模型涉及了潛在變數。識別資料集中潛在變數的方法有很多，其中一種常見方法是因子分析，因此潛變數結構模型的一種常見形式即是驗證性因子分析和路徑分析的組合，驗證性因子分析驗證潛在因子（潛在變數），之後將潛在變數代入路徑分析，假設並測試它們之間的關係。

關於SEM的基本概念描述，可參考前文。

接下來就以這種驗證性因子分析和路徑分析的組合形式為例，展示R包lavaan的潛變數結構模型的構建過程。

資料集

lavaan包的內建資料集PoliticalDemocracy，記錄了發展中國家政治民主和工業化的多種指標，共涉及75個物件（國家）和11個變數（政治民主或工業化指標）。

library(lavaan)

#資料集，詳情 ?PoliticalDemocracy

dat <- PoliticalDemocracy

head(dat)

對於11個變數，分別為：

y1，1960年新聞自由的專家評級；

y2，1960年政治反對派自由；

y3，1960年選舉的公正性；

y4，1960年當選立法機關的效力；

y5，1965年新聞自由的專家評級；

y6，1965年的政治反對自由；

y7，1965年選舉的公正性；

y8，1965年當選立法機關的效力；

x1，1960年人均國民生產總值（GNP）；

x2，1960年人均能源能耗；

x3，1960年工業勞動人口的百分比。

這些變數之間具有如下的結構關係：

y1、y2、y3、y4代表了1960年的政治民主指標（dem60 ~ y1 + y2 + y3 + y4）；

y5、y6、y7、y8代表了1965年的政治民主指標（dem65 ~ y5 + y6 + y7 + y8）；

x1、x2、x3代表了1960年的工業化指標（ind60 ~ x1 + x2 + x3）。

那麼可知，dem60、dem65和ind60即代表了資料集的潛在變數，反映了這些發展中國家的政治民主和工業化發展程度。不可否認，一個國家的政治民主發展水平和工業化發展水平之間存在密不可分的關係，因此我們可以推斷，潛在變數之間還存在這樣的結構關係：

dem60 ~ ind60；

dem65 ~ ind60 + dem60

綜合考慮（潛）變數和（潛）變數之間的因果關係，整個資料集可以建立如下模型：

那麼，我們的推斷是否合理呢？此時潛變數結構方程模型是個不錯的方法。

注：作為示例演示，以下操作忽略資料集是否滿足多元正態性。

lavaan的驗證性因子分析評估潛在變數

首先就是需要確定資料集中的潛在變數是否合適，我們使用驗證性因子分析來實現驗證過程。

##驗證性因子分析（CFA）

#假定潛變數

cfa_model <- '

#latent variables

ind60 =~ x1 + x2 + x3

dem60 =~ y1 + y2 + y3 + y4

dem65 =~ y5 + y6 + y7 + y8

#note that lavaan automatically includes latent covariances

#but we can add here anyway to be explicit

ind60 ~~ dem60

ind60 ~~ dem65

dem60 ~~ dem65

#執行 CFA，詳情 ?cfa

cfa_fit <- cfa(model = cfa_model, data = dat)

summary(cfa_fit)

#模型擬合度，詳情 ?fitmeasures

fitmeasures(cfa_fit, c('chisq', 'rmsea', 'cfi', 'aic'))

透過在驗證性因子分析中，預指定的潛在變數（潛在因子）和觀測變數間的關係，並比較預測矩陣和觀測矩陣的差異量化模型擬合度。幾種常見的評估擬合度的指標顯示，CFI值反映出模型擬合良好，但RMSEA值表明模型擬合度一般。如果期望改進模型（尋找更合適的潛在變數和觀測變數間關係），可參考前文驗證性因子分析中的方法（該文也有對CFI、RMSEA值等概念的描述，對於AIC的理解可參考該文）。

這裡作為示例，暫且認為潛在變數是合適的，即原始定義的模型是合理的。然後下一步進行潛變數結構方程建模。

lavaan的結構方程建模

我們將本篇一開始時假定的代表政治民主和工業化變數間因果關係結構輸入，進行SEM建模。

SEM建模與模型評估

lavaan中，結構方程模型透過sem()函式實現。

##結構方程模型（SEM）

#假定變數結構

sem_model <- '

#latent variables

ind60 =~ x1 + x2 + x3

dem60 =~ y1 + y2 + y3 + y4

dem65 =~ y5 + y6 + y7 + y8