一、全外顯子組測序(Whole Exome Sequencing,WES)
外顯子測序(WES)是對具有蛋白編碼功能的外顯子進行的測序技術,近年來全外顯子測序在發現外顯子基因突變方面逐漸得到廣泛應用。
2 利用序列捕獲技術將全基因組外顯子區域DNA捕捉并富集后進行高通量測序。
2 外顯子組測序的覆蓋度更深,數據準確性更高;對于基因組重測序成本較低,對研究疾病相關的SNP、Indel等具有較大的優勢。
2 基于大量的公共數據庫提供的外顯子數據,能夠結合現有的資源更好地解釋研究成果。
具有針對廣泛應用領域的變異識別功能
實現編碼區域的全面覆蓋
提供一個可替代全基因組測序的高性價比方法(每個外顯子組測序4–5 Gb,而每個全人類基因組測序約90 Gb)
與全基因組方法相比,生成的數據集更小、更易于管理,因此可以更簡單快速地進行分析
在不適合或不需要使用全基因組測序的情況下,外顯子組測序不失為一種高性價比的方法。它只對基因組的編碼區域進行測序,這樣便將資源集中到最可能會影響表型的基因,因此能夠一舉為您縮短周轉時間和節約成本。在檢測編碼外顯子中的變異時,外顯子組測序能夠將靶向內容擴大到非翻譯區(UTR)和microRNA,從而提供一個更全面的基因調控視野。僅需一天便能制備DNA文庫,而且每個外顯子組僅需測序4–5 Gb即可。

捕獲平臺:采用安捷倫最新的覆蓋最全面的人外顯子組捕獲panel—SureSelect人全外顯子V8


SureSelect 人全外顯子 V8 高度優化的捕獲探針設計結合嚴格的捕獲工作流程,獲得的高的在靶效率能夠確保讀出序列對靶標的特異性映射,從而實現深度覆蓋。此外顯子組靶向包括難捕獲區域的相關數據庫的更新內容,可實現蛋白質編碼區域的全面分析。
2 樣本類型DNA樣品;樣品濃度≥50ng/μl;樣品總量≥2ug
數據分析
1. 標準分析:原始數據基本分析、序列比對、SNP檢測等。
a) 基本信息分析:按Illumina 標準流程進行base calling、raw data 數據整理及數據質量評估;
b) 數據通過GATK, SAMtools 等檢測SNP 和InDel 變異信息;
c) 將SNP 和InDel 與最新發布的dbSNP 和千人基因組數據進行比對分析;
d) 變異所在基因的功能注釋;
e) 多樣本分析。
2. 高級信息分析:孟德爾遺傳疾病分析、復雜疾病分析、腫瘤癌癥分析等。
1. 最全面的內容,適用于任何應用的外顯子組解決方案
ü 包含相關數據庫的最新核心內容,可靶向包括難捕獲區域在內的更多外顯子
ü 輕松添加用于轉化研究的 UTR、用于癌癥研究的 COSMIC,或用于特定應用的定制內容
2. 高覆蓋率、高深度測序,可準確的檢測出疾病相關的常見及稀有變異
3. 建議測序深度
ü Germline變異相關建議測序深度80X以上(單基因/復雜疾病研究)
ü Somatic變異相關建議測序深度150X以上(腫瘤癌癥研究)
二、WES研究方案 — 基于全外顯子組測序的孟德爾遺傳疾病研究方案

孟德爾遺傳病,也稱單基因遺傳病,是指受一對等位基因(主效基因)控制的遺傳性疾病。孟德爾遺傳病是新生兒出生缺陷的重要原因之一,目前全球已知的單基因遺傳病大約7000多種,而且其中大部分的潛在疾病基因還尚未研究清楚。
傳統孟德爾疾病基因的識別主要是通過對候選基因實施Sanger測序而確定。候選基因的確定主要是通過一些基因組區域的位置映射方法,如核型分析,連鎖分析等。然而,這種方法不能確定疾病是由某個單核苷酸突變導致還是基因組結構變異導致。隨著二代測序技術的發展,尤其是外顯子測序技術的出現,使得基因組以及基因組蛋白質編碼區的常見及罕見變異都能被準確檢測到,極大地促進疾病基因的識別。
2 鑒定孟德爾遺傳疾病中的致病位點
2 家系樣本:患病個體及核心家系成員(系譜圖、臨床表型、年齡)
2 測序深度建議:≥ 80X
2 遺傳模式:常染色體顯性遺傳(AD);常染色體隱性遺傳(AR);伴性遺傳
生物信息分析路線

三、WES研究方案 — 基于全外顯子組測序的復雜疾病研究方案
由多個基因及環境因素相互作用所致的疾病,如心血管疾病、二型糖尿病、原發性高血壓、銀屑病等,稱為復雜疾病(complex disease)或多基因病(polygenic disease)。這類疾病發病率一般都超過0.001,在臨床或流行病學方面具有一定程度的家族傾向,但又不表現典型的孟德爾遺傳方式。復雜疾病是一種受多基因、多因子影響的疾病,包括遺傳因素、環境因素與其它因素。一般認為微效作用模式在復雜疾病的發生機制中起主要作用,即來自多個位點的大多數風險基因在群體中的發生頻率都很低,它們之間有相互作用,通過數量性狀的劑量效應關系,達到疾病發生的臨界域值,而共同決定了復雜疾病的遺傳易感性。
2 探索復雜疾病的致病機制,尋找與疾病顯著相關的致病和易感位點。
進行復雜疾病的研究需要具備兩個條件,一是要有遺傳背景一致或相似的資源群體;二是要有覆蓋全基因組的高密度的標記。利用和全外顯子組測序,我們可在全外顯子組范圍內獲取大量的準確性高的變異位點。
復雜疾病遺傳變異的研究依據研究對象不同的遺傳背景來源,分為基于家系和基于散發人群兩種研究策略。目前常規的分析方法如下圖所示:

樣本準備
2 Case-control散發樣本:疾病患者與正常對照樣本的外周血DNA。Case樣本數建議>200; control樣本數建議>200。樣本來源保持地域一致,例如:少數名族與漢族的分開。疾病分組若 按亞型來分,每種 亞型建議樣本數>100。
2 家系樣本:患病個體及核心家系成員(系譜圖、個體表型、年齡)。
2 測序深度建議:≥ 80X。
生物信息分析路線

四、WES研究方案 —基于全外顯子組測序的腫瘤驅動基因(driver mutation)研究方案
為什么會產生癌癥?我們需要提到一個名詞:驅動基因,它可以說是決定癌癥的最主要原因。如何找到驅動基因,是制定癌癥治療措施的關鍵所在。根據目前的發現,驅動基因包括:突變的EGFR、ALK融合基因、突變的KRAS、突變的HER2等的一大類都是驅動基因。例如,肺癌可按照驅動基因分為許多類,這是近年來非常重要的一個發現。由此可以根據不同的驅動基因,采用合適的藥物進行治療。如果找到驅動基因,治療就事半功倍,如果沒有找到驅動基因而盲目治療,靶向治療效果較差,可能連安慰劑都不如。
全外顯子組測序是用于分析基因組蛋白質編碼區域的一種功能強大的技術。這種大規模并行式分析結合了新一代測序的單分子分辨率,憑借能夠分析約含 20,000 個基因的外顯子基因組的高性價比單反應方法,已經在加速疾病基因發現中發揮了重要作用。
2 利用配對的腫瘤樣本進行高通量測序,檢測導致腫瘤發生的Driver mutation。
2 血液樣本:EDTA抗凝,2ml,-20℃冰箱保存。
2 新鮮冰凍組織:液氮冷卻、-80℃冰箱保存。
2 FFPE樣本:FFPE切片(10片左右,切片厚度在10μm左右)
2 腫瘤樣本 ≥ 150X
2 血液及正常組織樣本≥ 100X
五、全外顯子組測序技術路線與生物信息分析展示

1. 突變頻率分布圖

圖中展示了其中一個樣本在24條染色體上每兆(Mbp)區域類突變頻率分布,可以直觀看出該樣本在染色體上那些區域突變集中。綠色和紅色的是表示所有突變的頻率,其中紅色的表示在這1M區域內,target區域(試劑捕獲區域以及上下游25bp)小于500bp,藍色表示的是exonic上的突變頻率。
2. 突變功能分布圖

圖中展示了其中一個樣本突變功能分布情況。上方的餅圖表示在基因不同區域上(intron, exon, etc.)的變異所占的百分比;下方的餅圖表示在exon位置上不同變異類型所占的百分比。
3. 樣本拷貝數變異區間圖

其中右上角標注樣本名,圖中灰色的線條橫坐標是染色體位置坐標,縱坐標是平覆蓋度的z-score歸一化值,每折點是一個小的捕獲區間。灰色線條是參考對照的樣本的歸一化值變化情況,紅色或綠色代表該樣本的歸一化值變化情況,其中紅色表示DEL,綠色表示DUL。
4. 體細胞突變率及突變頻譜圖

圖形上方展示每對樣本體細胞突變數目,下圖展示每對樣本體細胞突變不同突變類型所占的比例。
5. 樣本體細胞突變heatmap圖

6. 體細胞突變富集分析圖

左邊縱坐標表示Go term,橫坐標是富集因子(Rich Factor = Gene number/Total Gene Number of the term)。每個圓圈的大小與在這個Go Term上的基因成正比,顏色與根據q-value的log值從紅到綠漸變,越紅,q-value值越低,富集越顯著。
7. 家系連鎖分析LOD連鎖圖及單倍型圖

左圖為LOD連鎖圖,通常,LOD值≥3被認為是兩個基因連鎖得確定證據(因為LOD值是以10為底的對數計算的,LOD值為3表明1000:1的機會,即所觀察到的連鎖不是偶然發生的);LOD值≥2時,可能連鎖;-2<LOD值<2時,需要更多地家系資料,尚不能判別是否連鎖;LOD值<-2時,為不連鎖;右圖為致病位點單倍型圖,可以根據此圖判斷致病位點是否在家系患病成員中處于共分離狀態。
8. 曼哈頓圖(Manhattan Plot)

X-軸為基因組坐標,Y-軸為每個單核苷酸多態性的關聯P-值的負對數。

癌癥全外顯子組測序提供了關于導致腫瘤惡化的編碼區突變的有用信息。通過測序全基因組的2%區域,能夠更為經濟地獲得更高的測序深度。了解癌癥外顯子組測序的更多信息。

對單個和多個個體的全外顯子組測序是尋找罕見病、復雜病或孟德爾病致病變異的常用方法。遺傳關聯與連鎖分析經由人群中普遍的遺傳變異,提供了復雜疾病研究的基礎。了解致病變異發現的更多信息。

外顯子組測序正越來越多地應用于轉化和臨床研究以了解基因在各種人類疾病中所扮演的角色。 了解轉化研究的更多信息。
六、中科普瑞科技服務團隊參與lncRNA芯片發表相關文獻
1. Chen DY, Liu XF, Lin XJ, Zhang D, Chai YC, Yu DH, Sun CL, Wang XL, Zhu WD, Chen Y, Sun LH, Wang XW, Shi FX, Huang ZW, Yang T, Wu H. A dominant variant in DMXL2 is linked to nonsyndromic hearing loss. Genet Med(2016.IF7.71.
2. Ping N, Sun A, Song Y, Wang Q, Yin J, Cheng W, Xu Y, Wen L, Yao H, Ma L, Qiu H, Ruan C, Wu D, Chen S. Exome sequencing identifies highly recurrent somatic GATA2 and CEBPA mutations in acute erythroid leukemia. Leukemia(2016).IF12.104.
3. Niu X, He W, Song B, Ou Z, Fan D, Chen Y, Fan Y, Sun X. Combining Single Strand Oligodeoxynucleotides and CRISPR/Cas9 to Correct Gene Mutations in-Thalassemia-induced Pluripotent Stem Cells. J Biol Chem(2016). IF4.258.
4. Liu H, Li F, Zhu Y, Li T, Huang H, Lin T, Hu Y, Qi X, Yu J, Li G. Whole-exome sequencing to identify somatic mutations in peritoneal metastatic gastric adenocarcinoma: A preliminary study. Oncotarget(2016). IF5.008.
5. Pu T, Guo Q, Cao R, Xu R, Sun K, Chen S. Using exome sequencing to identify the cause of myocardial hypertrophy in a Chinese family. Mol Med Rep(2015). IF1.484.
6. Yu WQ, You XD, Wang D, Dong W, Su J, Li CF, Liu JX, Zhang QQ, You Y, Wang XG, Huang J, Qiao B, Duan WY. Microarray analysis unmasked two siblings with pure hereditary spastic paraplegia shared a run of homozygosity region on chromosome 3q28-q29. J Neurol Sci(2015). IF2.474.
7. Jiang JH, Liu YF, Ke AW, Gu FM, Yu Y, Dai Z, et al. Clinical significance of the ubiquitin ligase E3C in hepatocellular carcinoma revealed by exome sequencing. Hepatology (Baltimore, Md)(2014). IF12.003.
8. Cheng L, Zhang Q, Yang S, Yang Y, Zhang W, Gao H, Deng X, Zhang Q. A 4-gene panel as a marker at chromosome 8q in Asian gastric cancer patients. Genomics(2013). IF3.010.
9. Yang J, Duan S, Zhong R, Yin J, Pu J, Ke J, Lu X, Zou L, Zhang H, Zhu Z, Wang D, Xiao H, Guo A, Xia J, Miao X, Tang S, Wang G. Exome Sequencing Identified NRG3 as a Novel Susceptible Gene of Hirschsprung's Disease in a Chinese Population. Mol Neurobiol. (2013). IF5.735.
10. Huang J, Deng Q, Wang Q, Li KY, Dai JH, Li N, Zhu ZD, Zhou B, Liu XY, Liu RF, Fei QL, Chen H, Cai B, Zhou B, Xiao HS, Qin LX, Han ZG. Exome sequencing of hepatitis B virus-associated hepatocellular carcinoma. Nat Genet(2012). IF35.532.
專注組學 精準定位 用心服務 幫您實現科研價值
——