日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

临床外显子组测序分析中的那些坑(下)

發(fā)布時間:2025/3/15 56 豆豆
生活随笔 收集整理的這篇文章主要介紹了 临床外显子组测序分析中的那些坑(下) 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

臨床外顯子組測序分析中的那些坑(上)

臨床外顯子組測序分析中的那些坑(中)

4.還記得嵌合嗎

?二代測序數(shù)據(jù)分析中已經(jīng)提到的另一個挑戰(zhàn)是嵌合SNV和CNV的出現(xiàn)。嵌合SNV已被證明與許多疾病相關(guān)。事實上,在癲癇相關(guān)神經(jīng)發(fā)育障礙患者中檢測到約3.5%的變異以嵌合形式存在。去除測序和分析假陽性位點的一種常見做法是排除變異突變豐度(VAF)低于預(yù)期的變異。然而,這種過濾也會去除嵌合SNV。例如,在懷孕33周的胎兒中,最初的篩選將PIK3CA中的一個嵌合(約16%)變異作為假陽性被過濾,這種致病變異(Chr3(GRCh37):g.178916854G>A NM_006218.4:c.241G>A p(Glu81Lys))導(dǎo)致心血管系統(tǒng)形態(tài)異常,這可以很好地解釋胎兒的超聲異常。通過靶向深度測序證實了該變異為嵌合,揭示了胎兒中約30%的突變豐度比例,而父母正常。

另一個挑戰(zhàn)是,在未受影響的父母中,致病性變異也以嵌合狀態(tài)存在,在進行trio分析時,主要關(guān)注顯性基因中新發(fā)突變的檢測。因此,在未受影響(嵌合)的父母身上發(fā)生的變異在孩子身上不會被標記為新發(fā)。因此,僅在尋找新發(fā)突變時,不會檢測到從嵌合親本遺傳的變異。

圖3C

例如,我們最初錯過了一個無義突變

TCF4 Chr18:g.53017619G>ANM_001083962.1:c.520C>TP(Arg174*),在篩選新發(fā)突變時,因為母親9%的reads也含有這種變異(圖3C)。理想情況下,在進行新發(fā)突變分析時,應(yīng)將此類變異作為一個單獨的類別進行檢測。或者,由于攜帶者父母的嵌合體水平較低,遺傳變異可能被誤解為偶發(fā),從而錯誤地估計父母的復(fù)發(fā)風險。總的來說,嵌合變異并不罕見。據(jù)估計,與常染色體顯性、常染色體隱性和X連鎖疾病相關(guān)基因中的嵌合變異發(fā)生在3.3%的個體中,而親本嵌合變異據(jù)估計高達17.5%。無論何時考慮與患者表型相關(guān)的潛在致病性變異,也值得考慮患者或父母嵌合性的可能性。

5染色體考慮?

如前所述,WES最初的目的是檢測SNV(見DA-2),盡管可以從WES數(shù)據(jù)分析CNV,但在解釋變異時,務(wù)必記住WES的局限性。例如,基于測序深度算法不檢測非整倍體,因為它將每個染色體的目標覆蓋率標準化。我們最初錯過了一例異二體X克氏綜合征(XXY),因為當時我們實驗室使用的唯一CNV分析工具沒有檢測出來。因為這是兩條完全相同的X染色體,所以X染色體上到處都是純合性(ROH)區(qū)域,正如你在未受影響的男性身上所預(yù)期的那樣。這種異二聚體X Klinefelter是通過QF-PCR分析,但可以通過查看WES數(shù)據(jù)中的Y/X覆蓋率更快地檢測到。

WES中一個相對常見的拷貝數(shù)發(fā)現(xiàn)是檢測到一條染色體上的末端重復(fù)與另一條染色體上的末端缺失相一致。這種結(jié)合是不平衡易位的明確指示,應(yīng)進行常規(guī)核型分析。一個類似的事件,在一名患有嚴重智力殘疾、發(fā)育遲緩、言語和語言缺失、肌張力減退和反流的患者中發(fā)現(xiàn)染色體22q13.3上的一個約265 kb末端缺失。因為22號染色體是一條近端著絲粒染色體,所以在這條染色體的短臂上沒有檢出。同一條染色體的長臂和短臂上的這種末端缺失表明存在環(huán)狀染色體。后續(xù)的核型分析顯示,這確實是一個新的環(huán)狀22號染色體(補充圖S9)。區(qū)分環(huán)狀染色體與“常規(guī)”末端畸變是至關(guān)重要的,因為有絲分裂期間的不穩(wěn)定性是環(huán)狀染色體的一個眾所周知特征。

隨后的繼發(fā)性畸變,如缺失區(qū)域的擴大,甚至受影響染色體的單體性,可能會對受影響個體產(chǎn)生相關(guān)的臨床后果。對于22號染色體,這種風險與2型神經(jīng)纖維瘤病(NF2;OMIM#607379)有關(guān),強烈建議隨后對這些患者進行NF2特征的終身常規(guī)篩查。

另一個例子是來自智力障礙和癲癇患者的WES數(shù)據(jù)發(fā)現(xiàn)在15q11.1q13.1上識別出約8.4 Mb的終端重復(fù)。僅基于WES數(shù)據(jù),尚不清楚這種重復(fù)是由間質(zhì)復(fù)制還是由額外的數(shù)字標記染色體引起的。在后續(xù)的核型分析中,這一事件被證明是一條等雙著絲粒標記染色體(q13.1)(圖3D),因此實際上是q11q13.1地區(qū)的四倍。這是一個與臨床相關(guān)的發(fā)現(xiàn),因為四體15q會引起許多非特異性特征,包括智力殘疾、行為障礙、共濟失調(diào)和癲癇(Finucane et al.,1993)。

這些例子表明,也有必要具備細胞遺傳學專業(yè)知識來解釋WES。從微陣列數(shù)據(jù)中解釋拷貝數(shù)變異的現(xiàn)有指南可以為來自外顯子測序數(shù)據(jù)的CNVs的解釋和后續(xù)隨訪提供指導(dǎo)。

圖3D

6. 真正的致病變異可能在人群數(shù)據(jù)庫中普遍存在?

過濾常見變異是外顯子組數(shù)據(jù)篩選的一個重要步驟,公開可用的數(shù)據(jù)庫,如gnomAD,提供來自大群體隊列的聚合變異信息具有很大的幫助,這種篩選的常用閾值消除了所有等位基因頻率>1%或基于疾病頻率和遺傳模式的數(shù)據(jù)。當應(yīng)用這種等位基因頻率過濾時,有很多原因?qū)е屡R床相關(guān)變異可能被錯誤地丟棄。

在一名智障患者中,我們檢測到DNMT3A中的錯義變異(c.2204A>G,p.(Tyr735Cys);NM_022552.5)。然而,在GnomAD數(shù)據(jù)庫中,這種變異也發(fā)生在11個人身上,因此最初被認為可能是良性的。幾項研究現(xiàn)已指出,由于克隆性造血作用,健康個體體內(nèi)可能會出現(xiàn)特定的變異,因此,這些(體細胞)變異在對照數(shù)據(jù)庫中出現(xiàn)的頻率相對較高,可以通過在老年人中過度表達(圖3E)和低變異等位基因分數(shù)來識別。標記這些與克隆造血有關(guān)的基因很有用。當有疑問時,對替代組織進行有針對性的突變分析有助于區(qū)分體質(zhì)變異和體細胞變異。

圖3E

?看似常見的致病性變異也可能是由于多聚體拉伸所致?;蛑械亩嗑垠w延伸是容易發(fā)生聚合酶滑移的區(qū)域,可導(dǎo)致許多核苷酸的插入或缺失。這些變異可能以假陽性的形式出現(xiàn)在對照數(shù)據(jù)庫中,但也可能是正在分析的測序數(shù)據(jù)中真正的致病變異。一個有趣的例子是從PRRT2基因(NM_145239.3:c.641_649)中九個核苷酸的均聚體片段中刪除或復(fù)制單個胞嘧啶(補充圖S10)。隨后的c.649del和c.649dup(RS5877771)變異出現(xiàn)在gnomAD數(shù)據(jù)庫中,等位基因頻率分別為0.96%和0.47%。這些高頻變異最初我們不認為這些變異是可能的致病變異。然而,這兩種變異都被認為是致病性的,因為它們會導(dǎo)致PRRT2基因的移碼,單倍體不足會導(dǎo)致癲癇、發(fā)作性運動誘發(fā)性運動障礙或兩者兼而有之。

PRRT2相關(guān)疾病的外顯率估計為60%或更高,這表明公共數(shù)據(jù)庫中均聚物變化的高等位基因頻率可能是由于測序誤差。事實上,gnomAD中有限的比對數(shù)據(jù)顯示,在某些區(qū)域,突變等位基因的分布不均。因此,在報告之前,如果與病例相關(guān),則必須通過另一項測試確認此類變異。雖然使用頻率數(shù)據(jù)庫過濾變異是一種有用的方法,但它并不完美。同樣,我們建議在數(shù)據(jù)解釋過程中納入強調(diào)已知致病性變異的保障措施,以避免遺漏更高人群頻率的變異(GeneRanger軟件已增加exception variant功能,防止高頻變異被遺漏)。

7.獨特的臨床特征可能推動正確的診斷

數(shù)據(jù)分析有時可能會根據(jù)質(zhì)量標準丟棄潛在的變異。在特定情況下,臨床表型可以幫助區(qū)分變異的優(yōu)先級,而無需額外的篩選步驟,甚至可以建議對特定基因進行詳細分析。僅在肉眼檢查測序數(shù)據(jù)后,才發(fā)現(xiàn)PHOX2B基因中的新發(fā)18bp重復(fù)事件,這是由新生兒先天性中樞性換氣不足綜合征的獨特表型引起的。該變異未被分析出,可能是由于該區(qū)域富含GC的重復(fù)序列中的測序讀數(shù)對齊不良(圖3F)。解釋也是一個挑戰(zhàn),因為該區(qū)域在脊椎動物中并不保守(許多脊椎動物缺乏丙氨酸重復(fù)序列的重復(fù)拉伸編碼),而且在gnomAD中存在許多重疊的缺失和重復(fù)事件。然而,這種位置的重復(fù)事件是中樞性換氣不足綜合征的復(fù)發(fā)原因。

圖3F

另一個明顯的臨床表型可能有助于識別高頻率的亞型等位基因的例子(另見VI-6)。我們對一個超聲異常的胎兒進行了產(chǎn)前外顯子組分析(眼球突出、小下巴、鼻前厚度、下肢內(nèi)收),我們最初只檢測到來自父親的1q21.1缺失,胎兒表型與血小板減少性橈骨缺失(TAR)綜合征的可能臨床診斷相匹配。該綜合征通常由1q21.1中的復(fù)發(fā)性微缺失引起,與位于-21的5'-UTR亞型變異結(jié)合,該亞型變異在gnomAD數(shù)據(jù)庫中的等位基因頻率>2%。放松頻率過濾后,位置-21處的變異確實出現(xiàn)了,并且起源于母體。

這些例子表明,患者的表型可能非常明確地指向單個基因或少量基因。不僅要注意那些可能未被call出的基因中的變異,還要注意其他不太可能的變異,例如可能影響剪接的沉默或深度內(nèi)含子變異(另見VI-2)。因此,有專門的專家來解釋特定疾病組的臨床外顯子組測序數(shù)據(jù)是有益的,因為這允許在他們的專業(yè)領(lǐng)域內(nèi)更深入地了解基因病因、非典型變異類型或基因型-表型相關(guān)性。然而,獲得正確診斷的能力將始終取決于完整臨床表型信息的可用性,最好是標準化格式。

8.表型信息可能具有誤導(dǎo)性

雖然表型信息對于正確的基因檢測至關(guān)重要,但它也可能通過選擇基因靶向檢測阻礙基因診斷。隨著基因?qū)嶒炇乙隢GS技術(shù)(如WES和WGS),轉(zhuǎn)診臨床醫(yī)生的診斷策略從表型優(yōu)先轉(zhuǎn)變?yōu)榛蛐蛢?yōu)先。我們可以清楚地看到,通過或多或少的無偏測序分析,已知疾病基因中的致病性變異也可以根據(jù)基因變異的位置或類型導(dǎo)致非常不同的臨床表型。

在一名患有新生兒張力過低、喂養(yǎng)問題、肌陣攣運動、眼陣攣、額葉隆起和棒狀足的兩歲兒童中檢測到IL11RA基因的復(fù)合雜合致病性變異,并懷疑存在線粒體疾病。然而,IL11RA基因與“伴有牙齒異常的顱縫骨病”(OMIM#614188)有關(guān)。在這種罕見的疾病中,沒有出現(xiàn)張力過低或運動障礙。根據(jù)這一發(fā)現(xiàn),CT掃描顯示該兒童和一名3歲的兄弟姐妹的縫合線早期閉合。該同胞隨后也被證明是IL11RA變異的復(fù)合雜合子。因此,額葉隆起,以及可能的clubfeet,是顱縫骨病的早期指標,而神經(jīng)系統(tǒng)特征可能由IL11RA變異解釋,也可能不由IL11RA變異解釋。

這種表型異質(zhì)性當然不是什么新鮮事,但NGS的實施已經(jīng)產(chǎn)生了許多最新的例子,例如致病性SRCAP和CREBBP變異分別導(dǎo)致Floating Harbor(OMIM#136140)和Rubinstein-Taybi(OMIM#613684)綜合征。這些基因中的變異也被描述為導(dǎo)致一個單獨的綜合征實體,具體取決于新發(fā)功能喪失變異的位置。疾病進展、不完整的臨床評估或表型異質(zhì)性最初可能具有誤導(dǎo)性。當檢測到明顯的致病性變異時,不應(yīng)太簡單將其視為“與表型不兼容”。

9.非孟德爾遺傳

WES數(shù)據(jù)分析和解釋的大多數(shù)標準過濾策略都基于經(jīng)典的孟德爾遺傳模式。雖然不完全外顯率在遺傳疾病中顯然不是一種新現(xiàn)象,但它確實對從NGS數(shù)據(jù)中有效過濾大量變異構(gòu)成了挑戰(zhàn)。尤其是在處理患者(健康)父母三人組數(shù)據(jù)時,變異篩選可能會導(dǎo)致顯性基因中的遺傳雜合變異被排除,或父系起源的女性或X連鎖隱性基因中雜合X連鎖變異被拒絕。

對一名患有嚴重智力殘疾、自閉癥和癲癇癥的年輕女性進行基于三人組的WES分析最初沒有得到診斷。在與轉(zhuǎn)診臨床醫(yī)生討論這一結(jié)果時,提到了PCDH19基因變異的可能性。PCDH19導(dǎo)致女性限制性X連鎖障礙的癲癇性腦病-9(OMIM#300088)。對數(shù)據(jù)有針對性的檢查確實揭示了PCDH19基因中的父系遺傳致病性變異(ChrX(GRCh37):g.99662889G>a NM_001184880.1:c.707C>T p.Pro236Leu)。這種錯義突變最初是由于健康的半合子父親遺傳,因此,我們應(yīng)該意識到雜合子PCDH19變異很可能是從未受影響的半合子父親那里遺傳來的。

另一組具有挑戰(zhàn)性的基因是那些具有親本印記的基因,因此它們的表達取決于傳遞等位基因的親本性別。目前已知大約有15種由印記位點引起描述良好的疾病,但除此之外,已知或預(yù)測有數(shù)百個基因會受到基因組印記的影響? (https://www.geneimprint.com/site/home)。在一名患有多種先天性異常的患者中,我們在IGF2基因中檢測到一種新的移碼變異,已知該變異存在印記,并且僅在父系等位基因上表達。由于無法從該患者的WES數(shù)據(jù)中提取基因組定相信息,我們無法確定IGF2變異存在于哪個等位基因上。

使用位于移碼變體上游3.5 kb處的信息性SNP(rs368743181)結(jié)合基因組分階段長讀測序可以確認這種突變確實發(fā)生在父系等位基因上,因此可以被認為是致病的。如果這種變異不是新發(fā)突變,而是從健康的父母那里遺傳下來的,那么識別這種變異將更具挑戰(zhàn)性。

在這里,檢測到每500-2000個體中就有1個發(fā)生單親二體事件也很重要。在UPD的情況下,兩條染色體都是從同一親本遺傳的,印跡基因的變異可能是疾病的原因(上海尋因提供trio WES分析UPD軟件)。用已知疾病機制的信息注釋基因?qū)τ诮忉學ES數(shù)據(jù)非常有用。

10.注意異構(gòu)體、假基因和基因拷貝

長期以來,我們對基因調(diào)控的概念一直被簡化為單一啟動子驅(qū)動基因轉(zhuǎn)錄,然后剪接前mRNA,刪除所有內(nèi)含子。如今,我們知道基因表達是以時間-組織-或發(fā)育階段依賴的方式控制的。例如,剪接異構(gòu)體可能缺少一個或多個外顯子(自然外顯子跳躍),具有額外的相關(guān)外顯子,具有不同的翻譯起始位點,或者基因可能具有多個啟動子,導(dǎo)致不同異構(gòu)體的出現(xiàn)。困難在于考慮哪種亞型與疾病有關(guān),如何評估存在于僅一個子亞型中的變異,或者如果在不同亞型之間的閱讀框不同,如何確保不丟失相關(guān)的“注釋”。

例如,我們在一名發(fā)作性共濟失調(diào)患者中確定了CACNA1A基因的Chr19(GRCh37):g.1333957G>變異。在五分之一的CACNA1A亞型中,這種變異是無義變異,NM_001127221.1:c.5569C>T.pArg1857*),而在其他四個中為內(nèi)含子(補充圖S11)。參與脊髓小腦性共濟失調(diào)6型(OMIM#183086)的polyQ擴展由另外兩種CACNA1A亞型(NM_001127222.2和NM_023035.3)編碼,表明這兩種亞型對正常的小腦功能至關(guān)重要。因此,事實上,無義變異僅存在于不編碼多聚核糖核酸的亞型中,因此最初使我們認為這種變異可能是良性的。然而,Graves等人表明,該亞型使用了一個替代的外顯子37A,而不是原始的外顯子37B,并且該亞型中的無義變異會導(dǎo)致偶發(fā)性共濟失調(diào)(OMIM#108500)。

或者因為整個亞型是多余的,因此亞型特異性變異可能表現(xiàn)為致病性或可能是良性的。最后,由于外顯子跳過,一些異構(gòu)體的閱讀框架部分不同,因此很難正確注釋其中的變異。對于在不同亞型中具有不同效果的變異,通??梢垣@得所有后果,但為了方便起見,最嚴重的后果是優(yōu)先考慮的(例如,終止密碼子丟失而非錯義)。然而,這可能會對一些疾病產(chǎn)生影響,比如努南綜合征,這些疾病具有功能獲得或顯性負效應(yīng)機制,其中錯義變異是致病性的,而無義變異不是。總的來說,重要的是確保在多個異構(gòu)體中調(diào)用和注釋變異,然后進行正確解釋,以避免遺漏相關(guān)變異。

此外,基因拷貝和假基因在WES中造成了嚴重的問題,因為短序列讀取的序列比對不明確,并且隨后在這些區(qū)域中缺乏變異檢出。出名的是完整疾病基因的拷貝,如SMN1、CYP21A2、PKD1、STRC或部分基因,如NEB基因內(nèi)8個外顯子的同源區(qū)。然而,其他變異可能會被call并顯示異常的變異等位基因部分,即純合子或雜合子中非常低的百分比時為雜合子,或者代表偽基因的假陽性調(diào)用,正如我們在STRC基因中發(fā)現(xiàn)的無義變異(補充圖S12)。在基于現(xiàn)有資源的解釋過程中,應(yīng)該讓人意識到這些基因,并使用獨立技術(shù)驗證這些變異的存在和合子性(如果已識別)。針對這一點,已經(jīng)提出了不同的實驗室方法,如基于NGS的拷貝數(shù)評估,輔以長程PCR堿基Sanger或MiSeq分析。此外,可以簡單地從分析中排除片段重復(fù)。由于假基因的存在,如果基于患者表型檢測已知致病性突變可能很困難,那么也應(yīng)該以有針對性的方式對患者進行檢測。

討論

在這里,本文提供了10多年來從臨床外顯子組測序中獲得的一些最重要的經(jīng)驗教訓。作為一個診斷實驗室對于質(zhì)量和穩(wěn)健性的關(guān)注并不鼓勵持續(xù)的變化。但在這個快速發(fā)展的領(lǐng)域,跟上時代和創(chuàng)新已經(jīng)成為一個必不可少的過程。通過提供我們在診斷工作流程開發(fā)過程中所犯錯誤的例子,我們希望我們不僅能夠讓人們意識到這些具體問題,而且能夠讓人們意識到診斷實驗室中確實存在錯誤。對于患者和推薦臨床醫(yī)生了解臨床外顯子組測序的局限性至關(guān)重要。這些限制最好在診斷報告中提及。盡管所犯的一些錯誤要求我們用正確的診斷重新聯(lián)系患者,但我們認為這在一定程度上是不可避免的,對犯錯誤的恐懼不應(yīng)妨礙創(chuàng)新和改進,因為從長遠來看,這對患者護理的危害比偶然的錯誤更大。

因此,重要的是要有一個全面的框架,以便在測序、數(shù)據(jù)分析和解釋層面及時發(fā)現(xiàn)錯誤和問題。通過提供基準數(shù)據(jù)集,以及促進實驗室之間的比較,有幾項舉措可以在這方面幫助實驗室。從這些例子中觀察到的一個有趣現(xiàn)象是,測序過程中出現(xiàn)的問題有時不是測序?qū)嶒炇易约喊l(fā)現(xiàn)的,而是分析數(shù)據(jù)的生物信息學家發(fā)現(xiàn)的。類似地,分子遺傳學家在數(shù)據(jù)解釋過程中經(jīng)常會發(fā)現(xiàn)數(shù)據(jù)處理中的錯誤。因此,在參與臨床外顯子組測序過程的不同部分(即測序設(shè)施、生物信息學和數(shù)據(jù)解釋)的成員之間建立常規(guī)反饋程序至關(guān)重要。

雖然這些例子似乎是非常罕見的例外,不太可能與日常病例有太大關(guān)聯(lián),但我們認為這些“例外”與罕見的遺傳疾病相似,這些疾病可能個別罕見,但總體上相當常見。當然,在執(zhí)行常規(guī)EXOME解釋時,盡可能多地考慮所有罕見可能性所需的時間并不總是可行的。因此,應(yīng)逐步優(yōu)化數(shù)據(jù)分析、注釋和程序,以增加此類臨床相關(guān)基因變異的自動提取。類似地,驗證、設(shè)置和執(zhí)行WES的多種可能分析,如檢測UPD、線粒體變異、重復(fù)擴增、,移動元件插入等。數(shù)據(jù)共享和再分析工作,可能會證明是有益的;并且可以利用大量樣本進行分析,雖然這些分析不太可能診斷任何單個樣本,但在一個大隊列中將識別少數(shù)病例。

我們在這里提出的錯誤可能不會是我們最后的錯誤。從長遠來看,我們努力從錯誤中學習,以改進診斷方法,我們希望其他人也能從我們的錯誤中學習。

譯者介紹

邊疆 男 2010年畢業(yè)于中山大學婦產(chǎn)科生殖內(nèi)分泌專業(yè),獲博士學位。專業(yè)方向:女性生殖力保存、環(huán)境生殖毒理學。從事婦科內(nèi)分泌疾病和女性生殖內(nèi)分泌臨床20余年

往期精品(點擊圖片直達文字對應(yīng)教程)

機器學習

后臺回復(fù)“生信寶典福利第一波”或點擊閱讀原文獲取教程合集

總結(jié)

以上是生活随笔為你收集整理的临床外显子组测序分析中的那些坑(下)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。