01
研究背景
格陵蘭人口的歷史上一直較小且孤立,其祖先在不到1000年前從加拿大北極地區進入格陵蘭,並沿西海岸向南遷移,然後沿東海岸向北遷移。最近幾代人與歐洲人的大量混血,使得現代格陵蘭人平均具有75%的因紐特人遺傳血統和25%的歐洲人血統。由於傳統的格陵蘭飲食富含脂肪和蛋白質,自然選擇在11號染色體上的CPT1A和FADS2區域產生了影響。因此,基於歐洲人的疾病遺傳架構可能不適用于格陵蘭。透過對448名格陵蘭人的深度全基因組測序和對另外5,558名格陵蘭人的全基因組推測,研究量化了歷史人口瓶頸及其對格陵蘭人口遺傳架構的影響。研究結果表明,格陵蘭的遺傳資料可以顯著改善疾病對映、診斷和預測,並且這些發現可以用於改善格陵蘭和其他北極地區的醫療保健。
格陵蘭的遺傳研究揭示了其獨特的遺傳架構,這一研究透過對5,996名格陵蘭人的基因組進行測序或推測分析,探討了人口瓶頸、結構和選擇如何塑造了格陵蘭人的遺傳特徵。研究發現,格陵蘭人群的遺傳架構具有較少但更常見的變異位點,這與歐洲人群相比,導致格陵蘭在代謝特徵上有兩倍的高影響力基因組關聯。這些高影響力變異是在與美洲原住民分離後出現的,具有北極特異性,並且不僅僅是由於遺傳漂變,還受到選擇的影響。此外,研究表明,歐洲衍生的代謝特徵多基因評分在格陵蘭人的準確性僅為歐洲人的一半,但加入北極特異性變異後,準確性可以提高到與歐洲人相同的水平。
02

研究發現
研究發現,格陵蘭因紐特人由於歷史上的人口瓶頸,其基因組中變異位點較少,但常見變異位點比例較高。這種遺傳結構導致了與代謝特徵相關的高影響力基因變異在格陵蘭的發現數量是歐洲的兩倍。這些高影響力變異是在與美洲原住民分離後出現的,具有北極特異性,並且不僅由於遺傳漂變,還受到選擇壓力的影響。此外,研究發現,歐洲衍生的多基因評分在格陵蘭人的準確性僅為歐洲人的一半,但加入北極特異性變異後,準確性提升至與歐洲人相同的水平。
研究總結了格陵蘭因紐特人的遺傳結構對疾病對映和預測的影響。研究表明,格陵蘭因紐特人中單基因疾病的臨床篩查由於缺乏公共遺傳資料庫的代表性而變得困難,但透過加入格陵蘭資料,可以將非因果候選變異的數量減少六倍。此外,研究還發現顯著的遺傳精細結構解釋了格陵蘭地區單基因疾病流行率的差異,並預測由於近期的遷移變化,某些隱性疾病的風險在未來將會降低。這些結果表明,包含格陵蘭人資料可以顯著減少基於基因組的醫療保健中的不平等現象。
03

臨床意義
特定變異的識別及其影響:研究識別了多種與代謝性狀相關的高影響力變異,這些變異在格陵蘭人群中的影響力是歐洲的兩倍。這些變異在北極特有,且部分由於自然選擇而常見。已知的TBC1D4變異用於糖尿病的診斷和治療,而SI變異與天生蔗糖酶-異麥芽糖酶缺乏症(CSID)相關,顯示出在格陵蘭及其他北極人口中的臨床應用潛力。基因篩查的改善:由於公共遺傳資料庫中缺乏格陵蘭人的代表性,臨床遺傳篩查變得困難。然而,格陵蘭資料的加入可以將非因果候選變異的數量減少六倍,從而提高篩查的準確性。多基因風險評分的適用性:研究發現,基於歐洲資料的多基因評分在預測格陵蘭人群的代謝性狀時,其準確性僅為歐洲人群的一半。然而,加入北極特有變異顯著提高了評分的準確性,與歐洲人群相當。單基因疾病的遺傳篩查:由於格陵蘭人群中非因果pLoF變異的數量高於其他種族群體,臨床上診斷單基因疾病的難度增加。透過增加格陵蘭的參考資料,這一問題得到了顯著改善。未來疾病風險的預測:由於歷史上格陵蘭的有限遷移和最近的流動性變化,某些隱性疾病(如ADCY3相關的肥胖、ATP8B1相關的膽汁淤積等)在未來的風險預計會降低。
04

實驗策略
1. 樣本與資料收集:研究團隊對448名格陵蘭人的全基因組進行了深度測序,並對另外5,548名使用SNP晶片(MEGA-chip, Illumina)進行基因分型的格陵蘭人進行了全基因組推測。這些樣本覆蓋了格陵蘭的不同地區。
2. 遺傳結構分析:透過遺傳重組圖(ARG)推測,研究人員量化了歷史上的人口瓶頸效應,發現格陵蘭因紐特人擁有較少但更常見的變異位點。這種遺傳架構導致了與代謝性狀相關的高影響力基因變異在格陵蘭的出現頻率是歐洲的兩倍。
3. 變異檢測與比較:識別出496,963個新的變異,以及232,525個數據庫中已知但不在gnomAD中的變異。研究發現,許多高影響力的變異是北極特有的,這些變異的高頻率不僅是遺傳漂變的結果,還受到選擇壓力的影響。
4. 多基因評分(Polygenic Scores, PGS)準確性評估:研究發現,基於歐洲人資料的多基因評分在格陵蘭人的準確性僅為歐洲人的一半,但加入北極特異性變異後,準確性提高到與歐洲人相同的水平。5. 疾病對映與預測:進行全基因組關聯研究(GWAS),揭示了特定代謝性狀在格陵蘭人群中的高影響力變異。研究還表明,透過在參考資料庫中包含格陵蘭人的資料,可以顯著減少非因果候選變異的數量,從而提高臨床篩查的準確性。6. 遺傳細緻結構與疾病傳播:研究揭示了格陵蘭內部顯著的遺傳細緻結構,這種結構解釋了單基因疾病在當地的流行差異。隨著現代流動性增大,某些隱性疾病的風險預期會降低。
05

資料解讀
圖1:遺傳結構比較
Figure 1 比較了格陵蘭因紐特人群與其他人群的遺傳結構特徵,包括變異頻率、單核苷酸多型性(SNP)分佈以及基因負擔等方面的差異。A. 為了展示格陵蘭因紐特人的遺傳結構,作者使用Relate工具從格陵蘭因紐特人的祖先重建圖(ARG)中推斷出混合比例和歷史有效種群大小,樣本來自格陵蘭的不同地點,樣本量為150個。B. 為了分析變異頻率與變異數量的關係,作者統計了不同等位基因頻率(AF)下的變異數量,變異被分為新變異、僅在dbSNP中發現的變異、在gnomAD中AF的變異和在gnomAD中AF 的變異。結果顯示,隨著等位基因頻率的增加,變異數量也增加,座標軸為對數刻度。C. 為了比較格陵蘭人和美洲人群中未在非洲、歐洲或亞洲人群中發現的SNP數量,作者對448名1KG美洲人和448名格陵蘭人進行了分析。結果顯示,格陵蘭人群中此類SNP的數量明顯高於美洲人群,注意兩個柱狀圖的y軸刻度不同。D. 為了研究不同人群基因組測序數量與分離SNP數量的關係,作者分析了不同人群中測序基因組數量與分離SNP數量的關係。E. 為了分析多型性SNP的比例與最小等位基因頻率(MAF)的關係,作者展示了不同MAF下多型性SNP的比例。結果表明,隨著MAF的增加,多型性SNP的比例也增加。F. 為了展示參與者的衍生等位基因的累積和,包括固定的衍生等位基因,作者計算了平均參與者的累積和。結果顯示,所有線條略微延伸超過100% DAF,表明它們最終達到相似的水平。G. 為了比較不同人群中受限制基因的基因負擔貢獻,作者分析了格陵蘭人、英國人(+CEU)和漢族人中最常見的預測有害SNP對基因負擔的貢獻比例。結果顯示,格陵蘭人中由單一常見變異主導的基因負擔比例較高,而英國人和漢族人中此比例較低。結論:格陵蘭因紐特人群與其他人群在遺傳結構上存在顯著差異,尤其是在變異頻率、SNP分佈和基因負擔方面。

圖2:遺傳結構對疾病定位的影響
Figure 2 探討了遺傳結構對疾病定位的影響,分析了不同人群中的變異頻率、標記SNP的數量、基因組關聯研究(GWAS)結果以及不同參考面板的推斷能力。A. 為了研究非致病性pLoF變異在不同人群中的分佈,作者計算了在gnomAD v.3.0.0參考面板中,MAF(次要等位基因頻率)大於0.1%的變異被移除後,剩餘的非致病性pLoF變異的平均數量(±標準誤)。結果顯示,去除高頻變異後,非致病性pLoF變異的數量有所減少。B. 與A相同,但使用不同的MAF閾值進行分析。結果表明,隨著MAF閾值的變化,非致病性pLoF變異的平均數量也隨之變化,反映了不同閾值對變異篩選的影響。C. 研究了標記SNP(R2 >0.8)的平均數量與焦點SNP距離的關係。結果顯示,標記SNP的數量隨著與焦點SNP距離的增加而減少。D. 分析了在不同MAF閾值下,INFO分數大於0.8的推斷變異數量。推斷使用了格陵蘭WGS與1KG合併的參考面板(n = 448 + 3,202)或僅使用1KG參考面板(n = 3,202)。結果表明,合併的參考面板在推斷變異數量上具有優勢。E. 比較了格陵蘭和歐洲在13種代謝特徵上的最大GWAS。結果顯示,在這些代謝特徵中,基因組關聯解釋的方差超過1%的情況,格陵蘭和歐洲存在差異。圖中列出了基因名稱及其相關的表型,對於糖尿病,使用了責任尺度方差解釋。星號表示該區域的致病基因不確定。F. 比較了歐洲衍生的多基因評分(PGS)在預測13種代謝特徵時的平均增量R2(±標準誤),並將其標準化至UK Biobank,分別針對所有格陵蘭參與者、僅未混合的格陵蘭參與者或丹麥參與者。結果顯示,加入北極特異性變異後,預測能力有所提高。G. 研究了在格陵蘭和UK Biobank中,基因組顯著關聯的主導SNP對175種血漿蛋白(Olink)的方差解釋,按照方差解釋排序,並按模型P值最低分組。插圖顯示了前20個GWAS命中結果的放大圖。結論:遺傳結構對疾病定位具有顯著影響,參考面板的選擇和變異頻率的篩選對GWAS結果和多基因評分的預測能力有重要作用。格陵蘭和歐洲在代謝特徵的基因組關聯研究中表現出不同的遺傳特徵。

圖3:遺傳結構對疾病定位的影響
Figure 3 旨在展示格陵蘭地區人群的遺傳結構及其細微差異,透過分析不同區域的遺傳成分、親緣關係和特定變異的分佈,揭示格陵蘭人群的遺傳多樣性和歷史。A. 為了研究格陵蘭不同地區人群的遺傳聚類,作者對各地區樣本進行了無監督的遺傳聚類分析。結果顯示,K=8時,各地區樣本的平均估計祖先成分比例透過柱狀圖展示。地圖上用顏色標識了格陵蘭的各個地區,並用黑點標示了樣本採集地點。B. 為了可視化出生地和樣本採集地在同一區域的人群(n=1,921),作者在前兩個主成分上進行了視覺化,並用出生地區域或推斷的祖先成分比例進行著色。放大的區域突出了位於聚類之間的人群的祖先成分分配。C. 為了分析各區域間的親緣關係,作者從遺傳資料中推斷出每10萬對可能關係中的親子關係和全同胞關係。灰色線條代表同胞關係,線條寬度表示推斷出的每10萬對可能關係中的同胞關係數量。彩色線條代表親子關係,顏色表示父母樣本採集的區域,線條寬度表示推斷出的每10萬對可能關係中的同胞關係數量。D. 為了研究五個高外顯率的北極特異性隱性變異在不同地區的等位基因頻率差異,作者分析了這些變異的區域差異。結果顯示,變異的變異係數分別為SI = 74%、ADCY3 = 251%、PCCB = 164%、TBC1D4 = 42%和ATP8B1 = 149%。E. 為了估算每個變異在當前精細結構下的純合子參與者的預期頻率,作者進行了分析,結果展示了在有和沒有當前精細結構的情況下的預期頻率。F. 為了估算八個北極特異性變異和FADS2變異的變異年齡,作者提供了估算的變異年齡及其95%置信區間。彩色百分比表示不同地區的土著等位基因頻率。垂直虛線表示各人群之間的分裂時間。結論:圖3揭示了格陵蘭地區人群的遺傳多樣性和歷史,透過分析不同地區的遺傳聚類、親緣關係和特定變異的分佈,展示了各地區人群的遺傳結構差異和特定變異的區域分佈特徵。

06

主要結論
這篇研究詳細分析了格陵蘭因紐特人群的遺傳架構,揭示了由於歷史上的人口瓶頸和遺傳漂變,其基因變異較少但常見變異較多。研究發現,格陵蘭人群中的代謝特徵與高影響力的基因變異相關,而這些變異在歐洲人群中較少見。此外,歐洲衍生的代謝性狀多基因評分在格陵蘭人的預測準確性僅為歐洲人的一半,但加入北極特有的變異後,準確性提升至與歐洲人相當。透過納入格陵蘭資料進行基因篩查,可以顯著減少非因果候選變異的數量。此外,研究還發現了顯著的遺傳精細結構,這解釋了格陵蘭不同地區單基因疾病的流行差異。隨著近期的遷徙變化,某些隱性疾病的風險預計會降低。這些結果表明,納入格陵蘭人群的資料可以顯著減少基因組醫療保健的不平等。
07

討論總結
納入未被充分研究的土著人群的基因研究可以幫助減輕基因組醫療保健的不平等。儘管格陵蘭與其他種群的衍生等位基因總和相當,但由於經歷了嚴重的人口瓶頸,格陵蘭的變異頻率分佈不同。研究表明,儘管整體遺傳疾病負擔可能與其他種群相似,但特定疾病的差異明顯,複雜疾病中高影響力變異的貢獻更大。許多常見變異是北極特有的,只有透過納入北極種群的研究才能進行探討。此外,由於參考面板中缺乏代表性,目前因紐特人的臨床篩查和風險預測較為困難,但透過加入一定數量的格陵蘭人全基因組測序資料,可以顯著改善這一情況。研究強調了在格陵蘭進行中等規模GWAS的潛力,並指出這些變異對於基於基因的早期預防和治療具有重大潛力。研究還發現格陵蘭人口中存在顯著的遺傳精細結構,這種結構解釋了格陵蘭疾病流行率的差異,並預測未來隱性疾病的患病率將降低。總體而言,研究結果突顯了格陵蘭及其他北極種群在基因研究中被代表的潛在益處,期望這些結果能夠促進更具包容性和公平性的基因組醫學研究。

—END—
