癌癥是一種涉及遺傳變異和表觀遺傳改變的復雜疾病,在其發生發展過程中獲得了一系列的代表特征,包括:持續的增殖信號,逃避生長抑制調控,抗細胞凋亡,永久復制能力,新生血管增生,侵襲和轉移的激活,能量代謝重編程,規避免疫破壞和炎癥的產生等。這些表型的遺傳基礎在于其基因組的不穩定性,這導致腫瘤的遺傳多樣性,進而呈現出上述代表性特征。除了遺傳基礎外,腫瘤的發生與發展還與表觀遺傳密切相關。DNA甲基化修飾是表觀遺傳的重要范疇,在染色質結構重塑,染色體穩定性維持,干細胞維持和自我更新,胚胎發育分化,個體的衰老和發育異常及疾病(如腫瘤、糖尿病、精神病及神經系統疾病等復雜疾病)的發生發展中起著重要作用。表觀遺傳學在疾病中的研究已越來越得到業界的廣泛認同,成為當今生命科學的一個重要的前沿和熱點領域。

圖 1. 腫瘤的代表性特征,以及遺傳/表觀遺傳在其中的作用機制。
以DNA甲基化修飾為代表的表觀遺傳既具備遺傳的穩定性,又能夠適時應對發育進化、環境改變以及免疫入侵等變化。人體中一套特定的染色體發展成200多種細胞,又能夠實時的適應環境變量,表觀遺傳的作用功不可沒。例如在免疫方面,造血母細胞分化過程中產生各種不同功能淋巴細胞的各種中,就受到DNA甲基化的調控。

圖 2. 表觀遺傳調控在造血母細胞分析過程中的調控作用示意圖。
我們建議對利用甲基化結合多組學的策略研究腫瘤這種涉及遺傳變異和表觀遺傳改變的復雜疾病,以更全面準確地對其分型及深入研究其機制。同時我們建議立足于腫瘤基因組及表觀基因組的不穩定性的基礎上,從免疫、炎癥、增殖、轉移、微環境、能量代謝重編程等新角度進一步分析腫瘤的致病機制。
服務推薦:中科普瑞 Illumina Infinium MethylationEPIC BeadChip服務(簡稱850K芯片)
甲基化芯片研究案例:
1、甲基化在細胞分化與腫瘤形成中的機制研究 - - 以正常B細胞為參照分析套細胞淋巴瘤的DNA甲基化譜
原文標題: Decoding the DNA Methylome of Mantle Cell Lymphoma in the Light of the Entire B Cell Lineage. PMID:27846393
腫瘤是一種發病機制復雜,個體差異很大的疾病,其基因組、轉錄組和甲基化修飾都會發生大量的變異,此外腫瘤的異質性更會對其研究增加難度。腫瘤研究的前沿將會向著單細胞的方向,排除腫瘤異質性的影響,更深入與細致地研究遺傳或表觀遺傳在腫瘤發生過程中的調控機制。
以下對套細胞淋巴瘤(mantle cell lymphomas,MCL) 甲基化修飾研究以分析其發生機制的案例,將給我們一個解決腫瘤異質性問題的提示。MCL是一種非霍奇金淋巴瘤,作為其正常對照的B淋巴細胞,本身就有著復雜的表觀遺傳背景,在成熟過程中的甲基化修飾發生了復雜的改變。本文在對82例套細胞淋巴瘤(MCL) 的DNA甲基化譜分析中, 不但考慮到了腫瘤本身的異質性,同時也以B 細胞成熟過程中各細胞亞群的甲基化譜數據進行比較分析。該研究發現:MCL可通過甲基化譜分為兩個亞群, 分別攜帶了生發中心(germinal center)和非生發中心的B細胞的甲基化印記; MCL淋巴瘤發生期間的甲基化譜在很大程度上受其來源的正常 B 細胞的甲基化動態的影響;遠端的增強子元件的表觀變異也可能是腫瘤的驅動原因;MCL的甲基化個體間差異很大,且甲基化變異的程度可以作為預后的指導[4]。

在腫瘤的研究中,會遇到腫瘤的異質性以及腫瘤細胞中混有其他正常細胞成份的情況,本研究中所得到的樣本中MCL的比例從56%~100%不等,這為其研究帶來了很大的偏差。研究者借鑒了EWAS中計算血細胞成分的算法,從分析上在結果中去除了非MCL的成份,“純化”了MCL細胞,得到可靠的甲基化數據。

經分析,MCL可分為兩大個亞群,通過主成分分析發現,MCL與B細胞發育中的后期樣本,在主成分1中更接近,而其中一個亞群(藍色點)與其來源的B細胞較接近。以下PCA圖與熱圖可直觀的看到不同的MCL亞群以及B細胞發育過程中各階段的樣本的相互關系,及其甲基化情況。

進一步分析發現,MCL與其來源的B細胞特定發育階段的樣本,在甲基化修飾上具有相似性。但在MCL中每個樣本變異的甲基化位點多,且個體差異很大,找不到很一致的變異。
作者注意到中進一步參考TMB,分析了甲基化變異負荷與預后的相關性,發現高甲基化變異的樣本,預后更差;同時也注意到,在C1亞群中,攜帶更多常見MCL突變的樣本,更易出現較多的甲基化變異。
最后,根據以上結果提出了MCL發生的(表觀)遺傳機制,MCL的發生既與其遺傳變異相關,也與B細胞在發育過程的階段相關,在生發中心進一步變異的B細胞形成了C1亞群的MCL,其后發育階段的B細胞變異形成了C2亞群的MCL。

2、甲基化分析揭示幼年型粒-單核細胞白血病中的不同亞型
原文標題: RAS-pathway mutation patterns define epigenetic subclasses in juvenile myelomonocytic leukemia. PMID:29259247
JMML是一種罕見的侵襲性骨髓增殖性疾病,有約50%是由KRAS,NRAS或PTPN11基因突變引起。目前對于 JMML 中的RAS通路的突變,與其生物學上的異質性和臨床結果的關系尚不清楚。本研究通過對JMML的DNA 甲基化的研究,發現可通過甲基化標記將JMML分為三個亞組(甲基化水平高、中、低)。甲基化水平高的病人,預后較差;甲基化水平低的病人,預后良好。
本文在分析中先分析了多功能造血干細胞(hematopoietic stem cells, HSC)與六種常見的血細胞(granulocytes, monocytes, NK cells, CD8+ T-cells, CD4+ T-cells, and B-cells)間的差異甲基化位點 ,這些位點是正常血細胞發育分化過程中變化的位點,在后續對JMML的分析中將被過濾掉。進一步找到JMML中變異的甲基化位點,以此作為對JMML的亞型區分的標記[5]。

進一步發現,利用找到的差異甲基化位點可將JMML區分為三個亞組,其中高甲基化的亞組的JMML病人預后較差,低甲基化的病人預后最好。

作者進一步分析了突變與甲基化譜之間的相關性,不過并沒有找到的顯著的關聯,不過發現JMML特異的甲基化位點與PRC復合物以及RAS的靶基因相關。

3、對上千例腦膠質瘤的多組學Meta分析得到更精細而可靠的分型
原文標題: Integrated Molecular Meta-Analysis of 1,000 Pediatric High-Grade and Diffuse Intrinsic Pontine Glioma. PMID:28966033
腫瘤是一種復雜的疾病,涉及基因組、表觀基因組的變異,以及轉錄組、蛋白質組和代謝組的變化,在經費允許的情況下,通過多組學的分析能夠更全面地了解其發生機制,并得到更可靠的分型結果。
本案例通過對超過1000例的小兒惡性膠質瘤(Pediatric glioblastoma,pGBM)和彌漫性腦橋膠質瘤(diffuse intrinsic pontine glioma,DIPG)病人的基因組和表觀基因組的Meta分析,主要關注于組蛋白突變,甲基化與CNV等方面。確定了組蛋白突變子群中的一些突變,如H3.3G34R/V 中的 FBXW7缺失、H3.3K27M 中的TOP3A 重排和 H3.1K27M 中的 BCOR 突變;通過基因組的關鍵變異和甲基化譜能夠對低級別腫瘤更細致地描繪。此外,由于基因變異隨著年齡增長而積累, 揭示對于嬰兒患者在生物學和臨床治療上的區別;對于小群體中出現的罕見通路紊亂,進一步確定了此疾病在分子層面的復雜性, 為其生物學研究開辟了新的途徑, 并為其未來的治療分層提供了功能界定基礎[6]。
首先對pGBM和DIPG的臨床病理學以及在組蛋白編碼基因變異、DNA甲基化修飾譜改變的水平上進行比較分析,同時比較不同的分型以及整合的分型結果對于預后上差異。

此外還分析了CNV對于疾病分型的效果,并綜合分析了發病部位、組蛋白變異、甲基化修飾的情況。進一步定位到了一些關鍵基因的CNV變異和重排,并進行了細致的展示。

最后,對一些關鍵基因的突變和CNV變異進行了匯總和展示 ;并結合關鍵的病理分型、組蛋白、甲基化和CNV等層面進行了整合分析;通過對整合的分子通路分析,發現此疾病個體差異很大,可能涉及到多種通路,為其治療提出了新的指導。

可見,整合的多組學分析,能夠在不同的分子層面上對腫瘤這類復雜的疾病進行全面的分析,提供更準確而細致的分型結果,是我們更準確的認識癌癥以及精準醫療的提供了有效的手段,這將是未來對于癌癥研究的方向與趨勢。
4、甲基化分子標記對于腫瘤診斷與預后的應用--對于多種常見腫瘤的診斷與預后
原文標題: DNA methylation markers for diagnosis and prognosis of common cancers. PMID:28652331
眾所周知,在腫瘤發生的早期就已經出現了基因的異常甲基化修飾,而且胞嘧啶的甲基化修飾也是一種在血漿中穩定存在并可精確檢測的,同時DNA的甲基化修飾還攜帶了其來源的組織的特征譜。所以甲基化修飾是一種極具潛在價值的腫瘤早期診斷分子標記,不過之前由于檢測技術上的不穩定,以及樣本的個體間差異,在缺少大量數據支持的情況下,甲基化分子標記一直沒有得到廣泛應用。不過得益于Infinium芯片技術的應用和數據的積累,我們可以對大量的穩定的數據進行綜合全面的分析,進行分子標記研究與開發工作。
本案例通過對三個腫瘤數據庫中約2800個腫瘤樣本(直腸癌、肺癌、乳腺癌和肝癌)和約590個對應正常組織的DNA甲基化水平進行分析,比較了不同組織來源的DNA甲基化修飾譜,以及腫瘤的甲基化特征譜。發現通過甲基化分子標記可以有效區分結直腸癌、肺癌、乳腺癌和肝癌四種常見惡性腫瘤,其中對正常組織和腫瘤組織區分的準確率基本上超過95%。此外利用甲基化分子標記還能夠從轉移灶中正確的識別癌細胞的原發來源,例如結直腸癌肝轉移病灶和肺轉移病灶可達到97%和94%的識別準確率[7]。

此外,利用特定位點DNA甲基化分子標記組合,也可以對多種腫瘤的預后進行預測,取得了較好的效果。

雖然在文章中所用到的分子標記數目較多,在實際應用層面還有需要進一步減少位點數,但此方法也為腫瘤的早期診斷及預后提供了很好的借鑒。
5、甲基化分子標記對于腫瘤診斷與預后的應用--ctDNA甲基化標記對肝癌的診斷及預后
原文標題: Circulating tumour DNA methylation markers for diagnosis and prognosis of hepatocellular carcinoma. PMID: 29035356
在之前的案例中介紹了利用甲基化分子標記進行多種常見腫瘤的診斷及預后的應用研究,以下案例是在之前研究的基礎上,針對肝癌進行了大規模的臨床數據分析和深度機器學習得到了用于肝癌早期篩查、風險評估和預后監測的甲基化模型[8]。
先從1000有差異的候選標記中利用分子掛鎖技術(padlock)進行篩選,得到了401個可用的標記,進一步在大量樣本中進行診斷與預后的機器學習尋找檢測標記panel和驗證,最后得到了10個CpG位點的診斷甲基化標記組合,以及8個位點的預后標記組合,詳見下圖。

下圖展示了10個診斷甲基化標記的列表,及其在訓練集與驗證集中的靈敏度、特異性、ROC曲線及熱圖。通過10個甲基化分子標記建立了肝癌的綜合診斷模型cd-score。其中在訓練集的靈敏度為87.5%, 特異性為94.3%;在驗證集中的靈敏度為83.3%, 特異性為90.5%。cd-score可以用于肝癌與肝臟類疾病的鑒別診斷,還可以根據分期、治療與否、手術是否殘留和肝癌復發等腫瘤負荷情況與甲基化水平的關聯用于腫瘤療效預測和監測腫瘤復發。

此外,還通過大量臨床數據機器學習方法篩選出8個肝癌預后甲基化標記(見下表),該panel在訓練集與驗證集中的生存曲線、及熱圖;以及合并了生存曲線的靈敏度、特異性見下圖。

6、甲基化分子標記對于腫瘤PD-1免疫治療預后的應用
原文標題: Epigenetic prediction of response to anti-PD-1 treatment in non-small-cell lung cancer; a multicentre, retrospective analysis. PMID: 30100403
PD-1是在活化的B細胞和T細胞中表達的免疫檢查點受體,其通過與癌細胞上的PD-L1配體結合,抑制T細胞活化,導致免疫抑制。抗PD-1治療晚期非小細胞肺癌(NSCLC)提高了患者的生存期,是目前倍受關注的免疫療法。然而,相當大比例的患者對此治療沒有反應,所以對其用藥指導的分子標記的開發與應用是當前研究熱點。目前對于檢查點抑制劑最熱門的分子標記是腫瘤突變負荷(TMB),而本文研究了DNA甲基化譜用于預測抗PD-1抑制劑-- nivolumab或pembrolizumab治療患者對當前IV期NSCLC患者療效的應用,并取得了良好的效果。
這是一項多中心研究,從法國、西班牙和意大利的15家醫院招募成年患者81名(發現集34名及驗證集47名)利用850K芯片分析其全基因組甲基化譜。這些患者經組織學證實為IV期NSCLC,并在疾病過程中曾接受過PD-1阻斷治療。在發現集中(應答者10名及無應答者24名)得到了301個CpG位點的組合(EPIMMUNE表觀遺傳特征),這組標記與無進展生存期和總生存期的預后顯著相關(圖1)。

圖1:發現隊列中EPIMMUNE與無進展生存期和總生存期的關聯。通過EPIMMUNE特征分析34例NSCLC患者的無進展生存期(A)和總生存期(B)的Kaplan-Meier分析。 NSCLC =非小細胞肺癌。 HR =風險比。
其后,在驗證集的47名患者(應答者14名,無應答者33名), 證明此EPIMMUNE表觀遺傳特征,仍與無進展生存期顯著相關(圖2)。

圖2:用EPIMMUNE特征分析抗PD-1劑治療的SCLC患者的驗證隊列生存曲線。Kaplan-Meier通過EPIMMUNE特征分析47例NSCLC患者的無進展生存期。 HR =風險比。 NSCLC =非小細胞肺癌。
其后又利用TCGA的公共數據對這些標記進行了驗證,確認其只與用藥有關,而非本身就與預后相關。由于TCGA的數據來源是450K芯片,所以只能取兩套芯片探針數據的交集(146個,EPIMMUNE-TCGA)進行驗證。首先證明EPIMMUNE-TCGA標簽在自己的數據集中仍然與用藥的預后相關(圖3A),并在TCGA數據集中確認這些標記與預后無關(圖3B)。

圖3:NSCLC患者中利用EPIMMUNE-TCGA特征的Kaplan-Meier臨床結果估計
(A)Kaplan-Meier通過發現隊列中的EPIMMUNE-TCGA特征估計無進展生存期和總生存期。 (B)Kaplan-Meier通過TCGA數據庫獲得的NSCLC患者的EPIMMUNE-TCGA特征的總體存活率估計,其中沒有人接受抗PD-1治療。 NSCLC =非小細胞肺癌。 TCGA =癌癥基因組圖譜。
其后又進行了放大樣本的驗證,用焦磷酸測序方法評價單個基因的甲基化預測效果,發現了FOXP1基因的甲基化情況也與抗PD-1治療后無進展生存率有關。
目前對PD-1抑制劑提出了多種生物標志物,包括:PD-1蛋白的表達,RNA轉錄譜,腫瘤突變負荷,腫瘤內細胞類型組成等。而此項研究突破性地證明了DNA甲基化譜在此方面也具備很好的預后效果,為腫瘤免疫療法的分子標記開創了新的研究方向。
專注組學 精準定位 用心服務 幫您實現科研價值
——