Automatic Scoring of Multiple Semantic Attributes With Multi-Task Feature Leverage: A Study on Pu...
原文連接:https://ieeexplore.ieee.org/document/7745891/citations
摘要
計算機和語義特征之間的間隙是制約臨床應用計算機輔助診斷性能的主要因素之一。為了架起這座橋梁,我們開發了三個多任務學習方法(MLT):利用堆疊去噪自編碼器和卷積神經網絡的深度學習模型衍生的異構計算特征,手工生成的Haar-like和HOG特征,CT圖像中肺結節的9個語義特征描述符。我們認為“細刺狀”、“紋理”和“邊緣”等語義特征之間可能存在一定的關系,可以使用MTL進行探索。LIDC數據集具有豐富的標注信息,很適合這項研究。實驗結果表明,與單任務的LASSO和可伸縮網絡的回歸方法相比,三種MTL方案的預測語義評分更接近于放射科醫生的評分。
9個語義特征
方法流程圖
需要解決的新問題
新CAD問題面臨很大的挑戰,可以主要概括為三個方面:
為了解決三個問題,提出了利用多任務學習框架的方法:
盡可能多的計算異構特征。使用SDAE提取一般特征(不需要標簽),使用CNN提取針對性強的特征,將這些特征和低級的Harr和HOG特征結合在一起。同時利用MTL進一步探索9個語義特征之間的關系。為避開切片厚度的變化,實現了基于切片的方案,也就是回歸模型的訓練是用二維切片ROIs 單元進行的,測試階段通過平均來自組合式切片ROIs的分數來獲得肺結節的最終評分。
貢獻
該論文的貢獻可以概括為三個方面:
方法
使用神經元生成特征
堆疊自編碼器(SAE)是一種深度學習模型,通過非監督和監督訓練兩個階段來實現。在無監督訓練階段,SAE體系結構是堆疊一個由一個輸入層和一個隱藏層組成的兩層自編碼器來構建的。自編碼器由編碼器和解碼器兩部分組成,可以通過尋找合適的編碼器和解碼器啦實現重構誤差的最小化。在沒有數據標簽的情況下,進行無監督的SDAE訓練,因此,其提取的特征對所有語義特征具有通用性。
CNN模型的訓練通常是在監督下進行的。針對9個語義特征使用了9個CNN模型,獲得了針對于特定任務的計算特征。對于每一個CNN,將每個語義描述作為一個單獨的類,作為分類問題進行訓練。
手動生成特征
通過簡單的逐塊計算來表征低級圖像的外觀和上下文信息。結節的外觀和紋理線索可以通過單塊和成對塊的Haar-like特征量化。
HOG使用局部方向梯度直方圖描述感興趣對象形狀的一種低級描述符。HOG特征可以用來幫助描述幾個形狀語義特征。
總結
為了得到計算機術語和醫學語義特征的映射關系。使用CNN、SDEA、Haar-like和HOG產生一個異構特征集合,針對醫生評分得到的9個語義特征,使用多任務線性回歸和隨機森林回歸產生特征和特定語義之間的最佳映射關系。
總結
以上是生活随笔為你收集整理的Automatic Scoring of Multiple Semantic Attributes With Multi-Task Feature Leverage: A Study on Pu...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 1.5 18:鸡尾酒疗法
- 下一篇: db2 load 快速_使用 DB2 的