群落分析的典範對應分析(CCA)概述

典範對應分析(CCA)與去趨勢典範對應分析(DCCA)概述
CA中有時會產生“弓形效應”,CCA中同樣如此。與此對應,衍生了去趨勢典範對應分析(Detrended Canonical Correspondence AnalysisDCCA)以解決這個問題。
本篇對CCADCCA作個簡介。
CCA演算法的簡化描述

CA的發展過程中出現了兩種計算方法,與此對應,存在兩種CCA的計算方法。儘管計算過程存在區別,但結果都是一致的。以下是CCA計算過程簡述,細節部分可參考LegendreLegendre1998)“Numerical Ecology”,594頁後的內容。
基於迭代的CCA(最初方法)
這種CCA 方法的基本思路是在基於迭代的CA過程中,將每輪迭代獲得的樣方得分(座標值)都與環境因子以多元迴歸的方式相結合。簡化步驟如下:
1)從任意(隨機)樣方得分(xi)開始。
2)以樣方中物種丰度加權的樣方得分(xi)平均值計算物種得分(uj),權重(wij)代表了物種(j)在樣方(i)中的丰度。
uj = ∑(wij * xi) / ∑(wij)
3)計算新樣方得分(xi),作為樣方中物種丰度加權的物種得分(uj)平均值。
xi = ∑(wij * uj) / ∑(wij)
第(13)步與CA過程完全相同,僅使用響應變數(物種多度)矩陣;第(4)步開始加入解釋變數(環境變數)資料。
4)透過多元迴歸計算樣方與環境變數之間的迴歸係數(bk),稱為典範係數(canonical coefficient),它反映了各個環境變數對排序軸所起作用的大小。
5)透過典範係數計算新樣方得分(xi)。
xi = ∑bkUki + b0
式中xi為第i個樣方的得分,b0是截距(常數),bk是樣方i與第k個環境變數之間的迴歸係數,Uki是第k個環境變數在第i個樣方中的測量值。
6)標準化樣方得分(軸因加權平均而收縮,因此拉伸軸),透過減去均值然後除以標準差實現。
7)如果新計算的樣方得分與舊樣方得分相同(或幾乎相同,即達到收斂),可停止執行;若仍存在明顯差異,繼續執行步驟(2)。
結合(17)過程,可以看到CCACA的區別是增加了(4)、(5)兩步,其它步驟沒有變化。並且同CA,無論從任意給定的隨機數開始,然後以特定的方式收斂,最終的解始終是唯一的。
8)在計算出第1軸的樣方和物種得分之後,可以繼續到第2軸以及更多軸,同時保持與所有先前計算的軸的線性獨立性。以第2排序軸為例,與第1排序軸一樣,進行(15),在選初始值時可以選第1軸某一步的結果,以加快迭代收斂速度。第(6)步時與CA一樣,先進行正交化,再進行標準化。
9)計算解釋變數(環境變數)得分。
fkm = [λ(1-λm)]1/2 akm
式中fkm為第k個環境變數在第m排序軸上的得分,λm為第1排序軸的特徵值,akm為第k個環境變數與第m個排序軸間的相關係數。這一相關係數不同於典範係數,它是最終求出的樣方得分與環境變數之間的相關係數,但其生物學意義與典範係數基本一致。
基於迭代的CCA(目前大多數軟體的方法)
這種CCA 方法為在CA分析中表徵χ2統計量的貢獻率的Ǭ矩陣中加入RDA的加權模式。
原始的響應變數矩陣(物種多度資料集)首先被轉化為一個描述樣方對對Pearson χ2統計量的貢獻率的Ǭ矩陣,透過Ǭ矩陣完成迴歸集,並使用加權多元迴歸代替簡單多元迴歸。其中權重為各樣方中所有物種的總和。
關於CCA軸的特徵

CCA可獲得的約束軸數為min[p–1, m, n–1]。其中,p為響應變數(物種)數量;m為定量解釋變數數量以及定性解釋變數(因子變數)的因子水平的自由度(即該變數因子水平數減1);n為排序物件(樣方)數量。
CA中,排序軸承載的總變差≠總方差,而是透過一個叫總慣量(total inertia)的指標表徵,它代表了Ǭ矩陣所有值的平方和。與此對應,CCAR2即代表了總慣量(而非總方差)被環境變數所解釋的程度,約束軸承載了被成功解釋的慣量部分。
根據計算過程,可以看到CCACA共享一套基礎演算法,CCA是在CA的基礎上新增約束過程發展而來,其約束演算法源自RDA中使用的多元迴歸。因此其很多特徵與CA(體現在樣方與物種的關係)或RDA(體現在環境變數的解釋規則)相似,可分別參考前文CARDA
CCA排序圖

CCA三序圖中一個非常矚目的特徵是物種在約束軸的排序位置反映其生態梯度最適點,這個特徵使物種組成的生物學解釋更加直觀和容易。
CCA排序圖中,樣方和物種常用點表示,定性解釋變數同樣以點表示(質心位置),定量解釋變數以向量表示。對於CCA中兩種主要標尺的解讀方式如下所述。
對於樣方和物種的關係,其解釋與CA中的解釋相同。
I型標尺圖中,(1)排序圖內樣方之間的距離近似於它們的χ2距離,排序圖中兩個樣方點越近,代表這些樣方內的物種組成越相似;(2)一個樣方點靠近一個物種點,表示該物種對於該樣方的貢獻比較大。
II型標尺圖中,(1)排序圖內物種之間的距離近似於它們的χ2距離,排序圖中兩個物種點越近,代表它們的相對多度沿樣方分佈越相似;(2)一個物種點靠近一個樣方點,表示該物種在該樣方記憶體在的可能性很大,或在該樣方內的多度比在其它樣方內大。
對於解釋變數(環境變數)與樣方或物種的關係。
I型標尺圖中,(1)將物件點垂直投影到變數向量或延長線上,投影點位置接近該樣方內該解釋變數數值的位置。(2)定性解釋變數質心的點靠近某一樣方,表明其在該樣方中的狀態更可能為“1”。
II型標尺圖中,(1)將物種點垂直投影到變數向量或延長線上,投影點的位置表示該物種在該環境變數梯度上的最適區域。(2)定性解釋變數質心的點靠近某一物種,表明該物種更可能出現在(或大量存在)該變數的狀態為“1”的樣方中。
CCA的一些注意事項

1)保證物種在生態梯度上呈單峰響應分佈。即環境梯度必須足夠長,在所觀測的樣方中具有明顯的物種丰度變化。梯度太短可能會表現出線性響應,儘管CCA也可以處理線性關係,但效果不如RDA
2CCA對稀有物種敏感,低丰度物種經常在CCA排序圖中作為異常值定位,帶來較大的偏差。可選在執行CCA前過濾它們,儘管不是必須的過程。
3)結果中,解釋變數代表了與響應變數的線性因果關係。如果不確定是否真實存在這種因果關係,則應謹慎進行解釋。
DCCA簡述

類似CA,作為單峰排序方法,CCA中同樣可能會出現弓形效應。可透過去趨勢典範對應分析(DCCA)將第一軸分成數個區間,並在每一區間內透過中心化調整第二軸的座標值,以去除弓形效應的影響,具體原理和去趨勢對應分析(DCA)類似。關於弓形效應和DCA,可參考前文
以下是對DCCA方法的簡化描述,基本過程同上述CCA,除了第(8)步。
1)從任意(隨機)樣方得分開始。
2)以樣方中物種丰度加權的樣方得分平均值計算物種得分。
3)以樣方中物種丰度加權的物種得分平均值計算新樣方得分。
4)計算樣方與環境變數之間的迴歸係數。
5)結合迴歸係數計算新樣方得分。
6)標準化樣方得分。
7)回到第(2)步,重複迭代過程,得到穩定的值。
8)可以看到,對於第1軸,計算方法和CCA相同。因為弓形趨勢隻影響正交軸,所以在第2軸開始,需將原來CCA中的正交化替換為去趨勢方法。
9)求環境變數得分。
儘管DCCA較少使用,但不可否認它的實用價值。
參考資料

張金屯數量生態學科學出版社, 2004.
DanielBorcard, FranoisGillet, PierreLegendre, et al. 數量生態學:R語言的應用(賴江山譯)高等教育出版社, 2014.
GUSTA ME Bloghttps://mb3is.megx.net/gustame/constrained-analyses/cca
RDA & CCAhttps://www.davidzeleny.net/anadat-r/doku.php/en:rda_cca_examples
Robustness of CCAhttp://ordination.okstate.edu/robust.htm
Legendre P, Legendre L. Numerical Ecology. Second English edition. Developments in Environmental Modelling, 1998, 20, Elsevier
連結

相關文章