深度学习,提高前列腺癌诊断正确率
文 / Google AI 醫(yī)療保健技術(shù)負(fù)責(zé)人 Martin Stumpe 和產(chǎn)品經(jīng)理 Craig Mermel?
在美國(guó),大約有九分之一的男性一生中會(huì)患上前列腺癌,這使其成為男性中最常見(jiàn)的癌癥。前列腺癌雖然常見(jiàn),但往往不具侵蝕性,因此醫(yī)生很難確定癌癥是否對(duì)患者構(gòu)成足夠大的風(fēng)險(xiǎn),以致于需要進(jìn)行治療,例如通過(guò)手術(shù)切除前列腺(前列腺切除術(shù))或放療。Gleason 分級(jí)是幫助我們對(duì)前列腺癌患者進(jìn)行 “風(fēng)險(xiǎn)分級(jí)” 的重要方法,其使用顯微鏡觀察載玻片,并根據(jù)樣本與正常前列腺之間的相似程度對(duì)癌細(xì)胞進(jìn)行分級(jí)。
然而,雖然前列腺癌 Gleason 分級(jí)的臨床意義已得到廣泛認(rèn)可,但過(guò)程非常復(fù)雜,并且具有主觀性。研究表明,病理學(xué)家對(duì)分級(jí)結(jié)果存在分歧的概率是 30% 到 53% [1][2]。此外,接受過(guò)專(zhuān)業(yè)培訓(xùn)的病理學(xué)家還遠(yuǎn)遠(yuǎn)不足,無(wú)法滿足全球的前列腺癌病理診斷需求,在美國(guó)以外的國(guó)家和地區(qū)尤其如此。最近提出的指導(dǎo)原則也建議病理學(xué)家在最終診斷報(bào)告中寫(xiě)明不同 Gleason 分級(jí)下的腫瘤預(yù)后良好概率,這不僅加大了病理學(xué)家的工作量,還為其帶來(lái)另一個(gè)主觀性挑戰(zhàn) [3]。總體來(lái)看,這些問(wèn)題表明,我們可以利用基于深度學(xué)習(xí)的模型來(lái)改進(jìn)前列腺癌的診斷和臨床管理。這類(lèi)似于?Google?及其他機(jī)構(gòu)利用此類(lèi)技術(shù)證明提高轉(zhuǎn)移性乳腺癌檢測(cè)準(zhǔn)確率的方法。
在《用于改進(jìn)前列腺癌 Gleason 評(píng)分的深度學(xué)習(xí)算法的開(kāi)發(fā)與驗(yàn)證》(Development and Validation of a Deep Learning Algorithm for Improving Gleason Scoring of Prostate Cancer) 一文中,我們探討了深度學(xué)習(xí)能否提升對(duì)前列腺切除術(shù)樣本進(jìn)行前列腺癌 Gleason 分級(jí)的準(zhǔn)確度和客觀性。我們開(kāi)發(fā)了一個(gè)深度學(xué)習(xí)系統(tǒng) (DLS),首先將載玻片中的每個(gè)區(qū)域?qū)?yīng)至 Gleason 模式,與正常前列腺相似程度越高的腫瘤,對(duì)應(yīng)的模式就越低,以此反映病理學(xué)家的工作流程。然后,DLS 根據(jù)所呈現(xiàn)的兩種最常見(jiàn) Gleason 模式總結(jié)整體 Gleason 分級(jí)組別。分級(jí)組別越高,癌癥進(jìn)一步惡化的風(fēng)險(xiǎn)就越大,而患者從治療中獲益的可能性也越大。?
Gleason 模式的直觀示例,該模式用于對(duì)前列腺癌進(jìn)行分級(jí)的 Gleason 系統(tǒng)。系統(tǒng)根據(jù)癌細(xì)胞與正常前列腺組織的相似程度,為單個(gè)癌細(xì)胞圖塊分配 Gleason 模式。模式編號(hào)越小,對(duì)應(yīng)的腫瘤分化程度就越好。圖像來(lái)源:美國(guó)國(guó)立衛(wèi)生研究院
為了開(kāi)發(fā)和驗(yàn)證 DLS,我們收集了已去除個(gè)人信息的前列腺切除術(shù)樣本圖像,其中包含的前列腺癌細(xì)胞數(shù)量和種類(lèi)比通過(guò)針刺活檢獲得的要多,雖然后者是更常用的臨床過(guò)程。在訓(xùn)練數(shù)據(jù)方面,有 32 位病理學(xué)家針對(duì) Gleason 模式提供了詳細(xì)注釋(最終得到超過(guò) 1.12 億個(gè)經(jīng)過(guò)注釋的圖塊)和每張圖像的整體 Gleason 分級(jí)組別。為了克服前文提及的 Gleason 分級(jí)可變性問(wèn)題,驗(yàn)證數(shù)據(jù)集中的每個(gè)載玻片都分別由 3 至 5 位一般病理學(xué)家(從 29 位病理學(xué)家中選出)獨(dú)立分級(jí),并由一位泌尿生殖專(zhuān)業(yè)病理學(xué)家作出最終的 Gleason 分級(jí),從而獲得該載玻片的真實(shí)標(biāo)記。?
在論文中,我們展示了 DLS 的整體準(zhǔn)確率達(dá)到 70%,而在我們的研究中通過(guò)美國(guó)執(zhí)業(yè)資格認(rèn)證的普通病理學(xué)家的平均準(zhǔn)確率為 61%。我們選出 10 位在為驗(yàn)證數(shù)據(jù)集中每個(gè)載玻片分級(jí)中表現(xiàn)出色的一般病理學(xué)家,而 DLS 的準(zhǔn)確率超過(guò)了其中 8 位。在 Gleason 模式定量分析中,DLS 的準(zhǔn)確率也高于一般病理學(xué)家。我們可以將這些對(duì) Gleason 分級(jí)的改進(jìn)解讀為更好的臨床風(fēng)險(xiǎn)分級(jí):在識(shí)別術(shù)后疾病復(fù)發(fā)風(fēng)險(xiǎn)更高的患者方面,DLS 的表現(xiàn)優(yōu)于水平一般的病理學(xué)家,這可能會(huì)使醫(yī)生能夠根據(jù)這些信息選擇更適合患者的療法。
DLS 與病理學(xué)家的評(píng)分表現(xiàn)比較。a:DLS 的準(zhǔn)確率(以紅色表示)與 29 位病理學(xué)家平均準(zhǔn)確率(以綠色表示)的比較。誤差線表示 95% 的置信區(qū)間。b:DLS、29 位病理學(xué)家,以及泌尿生殖專(zhuān)業(yè)病理學(xué)家提供的風(fēng)險(xiǎn)分級(jí)比較。我們根據(jù)患者的 Gleason 分級(jí)組別,將他們分為高風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)組。這些風(fēng)險(xiǎn)組生存曲線(Kaplan-Meier 曲線)之間的較大分離區(qū)域表示更準(zhǔn)確的分級(jí)
我們還發(fā)現(xiàn) DLS 能夠描繪組織形態(tài)特征,這些特征似乎位于兩種 Gleason 模式的相交位置,這是病理學(xué)家進(jìn)行 Gleason 分級(jí)時(shí)出現(xiàn)分歧的一個(gè)原因,也表明我們或許可以更加細(xì)分前列腺癌的 “精確分級(jí)”。雖然這些中間模式(例如 Gleason 模式 3.3 或 3.7)的臨床意義尚不明確,但 DLS 提升的精確度將會(huì)推動(dòng)對(duì)這一有趣問(wèn)題的進(jìn)一步研究。?
評(píng)估 DLS 的區(qū)域級(jí)別分類(lèi)。a:3 位病理學(xué)家的注釋與 DLS 預(yù)測(cè)的比較。病理學(xué)家對(duì)腫瘤區(qū)域位置和范圍的判斷展現(xiàn)出普遍一致性,但在對(duì) Gleason 模式進(jìn)行分類(lèi)方面有較大分歧。系統(tǒng)通過(guò)在 Gleason 模式 3(綠色)、4(黃色)和 5(紅色)的 DLS 預(yù)測(cè)模式間進(jìn)行插值,來(lái)展示每個(gè)區(qū)域的 DLS 精確 Gleason 模式。b:DLS 預(yù)測(cè)?
模式與病理學(xué)家對(duì)測(cè)試數(shù)據(jù)集中 4100 萬(wàn)已注釋圖塊作出的 Gleason 模式分類(lèi)之分布情況的比較。病理學(xué)家存在分歧的圖塊中的組織更有可能位于兩種模式的相交位置,DLS 在其預(yù)測(cè)分?jǐn)?shù)中反映出這種不明確性
雖然這些初步成果很振奮人心,但在將類(lèi)似 DLS 的系統(tǒng)應(yīng)用于改進(jìn)對(duì)前列腺癌患者的治療之前,我們還有很多工作要做。首先,我們可以利用更多訓(xùn)練數(shù)據(jù)進(jìn)一步提高模型的準(zhǔn)確度,并基于包含更多和更多樣患者的獨(dú)立群體進(jìn)行驗(yàn)證。此外,我們正在積極完善 DLS 系統(tǒng),以將其用于診斷性針刺活檢,此類(lèi)活檢會(huì)在患者決定接受手術(shù)前進(jìn)行,也是 Gleason 分級(jí)在臨床決策方面具有更重大影響的原因。我們還需要進(jìn)行更深入的研究來(lái)評(píng)估如何以最佳方式將 DLS 整合到病理學(xué)家的診斷工作流程中,以及評(píng)估這種基于人工智能的輔助方法在臨床實(shí)踐中對(duì) Gleason 分級(jí)整體效率、準(zhǔn)確率和預(yù)后判斷能力的影響。盡管如此,我們?nèi)匀粸檫@類(lèi)技術(shù)顯著改進(jìn)癌癥診斷和患者治療的潛力感到振奮。
致謝
此項(xiàng)研究是多學(xué)科團(tuán)隊(duì)的努力成果,其中包括軟件工程師、研究人員、臨床醫(yī)生和后勤支持人員。此項(xiàng)目的主要貢獻(xiàn)者包括 Kunal Nagpal、Davis Foote、Yun Liu、Po-Hsuan (Cameron) Chen、Ellery Wulczyn、Fraser Tan、Niels Olson、Jenny L. Smith、Arash Mohtashamian、James H. Wren、Greg S. Corrado、Robert MacDonald、Lily H. Peng、Mahul B. Amin、Andrew J. Evans、Ankur R. Sangoi、Craig H. Mermel、Jason D. Hipp 和 Martin C. Stumpe。我們還要感謝 Tim Hesterberg、Michael Howell、David Miller、Alvin Rajkomar、Benny Ayalew、Robert Nagle、Melissa Moran、Krishna Gadepalli、Aleksey Boyko 和 Christopher Gammage。最后,如果沒(méi)有為此項(xiàng)研究注釋數(shù)據(jù)的病理學(xué)家的幫助,這個(gè)項(xiàng)目也不會(huì)成功。
參考文獻(xiàn)
中樞和局部病理學(xué)家在根治性前列腺切除術(shù)組織學(xué)評(píng)估中的觀察者間差異:TAX 3501 多國(guó)臨床試驗(yàn)發(fā)現(xiàn) (Interobserver Variability in Histologic Evaluation of Radical Prostatectomy Between Central and Local Pathologists: Findings of TAX 3501 Multinational Clinical Tria).?Netto, G. J.,Eisenberger, M.,Epstein, J. I. 和 TAX 3501 試驗(yàn)研究者.《泌尿?qū)W》(Urology)?77,1155–1160 (2011)
pT3 期前列腺癌輔助性放療與等待觀望的第 3 階段對(duì)比研究:病理回顧對(duì)分析的影響?(Phase 3 Study of Adjuvant Radiotherapy Versus Wait and See in pT3 Prostate Cancer: Impact of Pathology Review on Analysis).?Bottke, D.,Golz, R.,St?rkel, S., Hinke, A.,Siegmann, A.,Hertle, L.,Miller, K.,Hinkelbein, W.,Wiegel, T.《歐洲泌尿外科雜志》(Eur.Urol)?64,193–198 (2013)
前列腺活檢和前列腺切除術(shù)樣本中定量 Gleason 分級(jí)的應(yīng)用?(Utility of Quantitative Gleason Grading in Prostate Biopsies and Prostatectomy Specimens). Sauter, G.,Steurer, S.,Clauditz, T. S.,Krech, T.,Wittmer, C.,Lutz, F.,Lennartz, M.,Janssen, T.,Hakimi, N.,Simon, R.,von Petersdorff-Campen, M.,Jacobsen, F.,von Loga, K.,Wilczak, W.,Minner, S.,Tsourlakis, M. C.,Chirico, V.,Haese, A.,Heinzer, H.,Beyer, B.,Graefen, M.,Michl, U.,Salomon, G.,Steuber, T.,Bud?us, L. H.,Hekeler, E.,Malsy-Mink, J.,Kutzera, S.,Fraune, C.,G?bel, C.,Huland, H.,Schlomm, T.《歐洲泌尿外科雜志》(Eur.Urol) 69,592–598 (2016)
更多 AI 相關(guān)閱讀:
利用切換選項(xiàng)和模式擴(kuò)展您的智能家居操作
單目視頻無(wú)監(jiān)督深度學(xué)習(xí)的結(jié)構(gòu)化方法
“夜視”(Night Sight) 模式:Pixel 手機(jī)可在夜間視物
總結(jié)
以上是生活随笔為你收集整理的深度学习,提高前列腺癌诊断正确率的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: jitter单位_时间抖动(jitter
- 下一篇: 我的三年自学深度学习之路